淘宝商品评价属性分类研究.doc

淘宝商品评价属性分类研究.doc

ID:51100670

大小:76.00 KB

页数:5页

时间:2020-03-18

淘宝商品评价属性分类研究.doc_第1页
淘宝商品评价属性分类研究.doc_第2页
淘宝商品评价属性分类研究.doc_第3页
淘宝商品评价属性分类研究.doc_第4页
淘宝商品评价属性分类研究.doc_第5页
资源描述:

《淘宝商品评价属性分类研究.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、淘宝商品评价属性分类研究  摘要:设计了一个基于API技术的淘宝商品评价分类系统。利用淘宝开放平台提供的API接口获取商品评价信息,然后将这些评价信息按照质量、物流以及服务态度等属性分别分出好评和差评,通过对典型操作实例的理论分析和实验结果,验证了该方法的有效性。  关键词:淘宝API;评价属性;评价分类  淘宝开放平台是一个综合性、商业性的开放平台[1]。TOP发布的API涵盖了商品、产品、类目、用户、交易、评价和物流等不同专业领域的开放接口。使用这些预先定义好的函数,可以更加方便、快捷地调用这些接口来完成一些有关处理工作。  淘宝网作为国内最大的电商网站,每月每天甚至每小时的

2、交易量都是相当大的,而作为买家在淘宝网上购买商品之后,无论对商品满意与否,都可以通过淘宝网提供的商品评价系统对所购买的商品作出自己的评价,这就产生了大量的评价信息。这些评价对今后购买同种商品的买家可以产生重要的指导作用;评价信息里反映出的买家对商品比较关注的一些问题也为卖家不断改进商品提供了方向。  但是目前淘宝评价系统只是单纯地将买家的评价罗列在产品信息页面上,这些评价包含了买家对该商品在做工、款式、服务态度、发货速度和物流速度等相关评价属性的信息反馈,这对想查看该商品某种评价属性信息的买家和卖家带来了很大的困难。有些商品评价信息较少,可以通过逐条查看的方法来获取需要的信息。但

3、是对于有几千条甚至上万条评价信息的商品来说,逐条查看必定会耗费大量的精力,也无法取得较好的效果。同时,淘宝提供的好评、中评和差评都是由买家人工选择的。有时候买家对商品并不很满意,但是由于卖家服务态度较好等原因也给出了好评;而有些差评则是因为卖家服务态度不好或者物流送货不及时等原因,但是商品本身质量并没有问题,这就对信息获取造成了误差。针对上面的问题设计并实现的淘宝商品评价属性分类系统,利用淘宝开放平台提供的API技术获取相关评价信息,然后按质量、物流和服务这3项关注度最高的属性将评价信息进行分类,并对每种属性按评价内容情感倾向度分别判别出好评和差评。本系统实现了买家在淘宝网意向商

4、品的大量评价中筛选出自己希望了解的关于商品某属性的评价信息,同时也帮助卖家了解在售商品各个属性的买家反馈信息,更好地改进商品。  1相关工作  本系统通过评价API接口获取商品评价信息作为基本的数据来源。系统中的商品评价主要分为两类。(1)按照商品属性进行分类。商品的属性特征都是由它的特征词来表现的,主要是能够定义属性的名词或者名词短语。本系统将评价信息按照质量、服务、物流3个属性进行分类。(2)按照情感倾向度进行分类。本系统提取评价信息中的情感词并按照一定规则组成短语模型与事先建立好的短语模型情感倾向库进行匹配,开发了一种计算情感倾向度的算法,按照此算法将商品的每个属性都分为了

5、好评和差评。  2系统的具体设计  2.1评价API获取评价内容  该模块主要是获取评价文本和文本转存两个功能。使用API要先创建一个ITopClient对象,向接口地址/router/rest发起连接请求,请求成功后,建立TraderatesGetRequest评价文本查询请求对象,设置请求的字段和参数,再建立TraderatesGetResponse对象接收返回的数据,把获得评价文本内容保存到文本文件。格式是Json字符串。  2.2建立商品属性特征词库  商品特征词的抽取主要有分词标注和按规则抽取特征词两个步骤。  (1)要抽取特征词,必须要用分词工具先把句子分成词语,然后

6、对词性进行标注,才能分析每个词语的意义。使用SHARPICTCLAS分词工具分词标注,例如:衣服/n很/d/a!/w很/d合身/a!/w店家/n服务/vn态度/n也/d很/d好/a,/w虽然/c中间/f出/v了/ul点/q小/a插曲/n,/w但是/c很/d快/a都/d给/v解决/v了/y。/w店家/n工作/vn相当/d给/p力/n。/w快递/vn也/d很/d给/p力/n!/w赞/vg一个/m!/w  (2)分词标注之后,还要过滤掉一些没有意义或者不是想要的词。首先就是根据词性过滤。例如店家/n服务/vn态度/n也/d很/d好/a,这个是标注完毕的句子,看到“服务态度”这个名词短语

7、其实就是商品服务的一个特征,也可以简化成“态度”。前面提过,只有名词或名词短语才能表示商品的属性特征,所以可以把名词短语以外的非名词词语过滤掉,上面的例子过滤后就是“店家/n服务/vn态度/n”,其他词性就不要了。然后再根据手工收集的一些无意义词文件,过滤掉无意义词,最后去除词性标注,合并同类项,再利用Apriori算法中的频繁项定义,过滤掉噪音词,属性特征词库就建立了[2]。将需要分类的评价信息分词标注之后与属性特征词库进行匹配,实现按照商品评价属性分类。  2.3基于构造短语

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。