从评论语料库中挖掘产品特征词论文

从评论语料库中挖掘产品特征词论文

ID:6185052

大小:473.50 KB

页数:29页

时间:2018-01-05

从评论语料库中挖掘产品特征词论文_第1页
从评论语料库中挖掘产品特征词论文_第2页
从评论语料库中挖掘产品特征词论文_第3页
从评论语料库中挖掘产品特征词论文_第4页
从评论语料库中挖掘产品特征词论文_第5页
资源描述:

《从评论语料库中挖掘产品特征词论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、从评论语料库中挖掘产品特征词毕业论文目录中文摘要I英文摘要II1绪论11.1研究背景11.2选题意义11.3从评论语料库中挖掘产品特征词的研究现状21.4产品特征词挖掘的发展前景31.5汉语分词介绍31.5特征词挖掘的相关算法61.6开发环境介绍62产品特征词的挖掘82.1问题的提出及相关研究82.2评论语料库使用的现状92.3弱监督机器学习方法介绍92.4产品评论内容的分析132.5产品评论统计特征的提取132.6模式结构与模式特征集143系统设计163.1系统总体设计163.2系统界面设计163.3特征词挖掘的系统设计214系统测试234.1系统功能测试234.2系统的不足244.3系

2、统的后续工作24总结26致谢27参考文献2828重庆科技学院本科毕业生论文1绪论1绪论1.1研究背景随着Internet的广泛应用,用户使用产品会通过Web对产品进行评论,这些评论中包含用户对产品的各个方面的性能持有肯定还是否定的意见。产品评论中蕴涵了丰富的信息,生产厂商分析产品评论可以了解产品的不足和用户实际需求以改进产品,用户浏览产品评论可以在购买产品之前更多地了解产品,从而更加合理地购买产品。要从大量使用自然语言进行描述用户评论获取信息,只有通过人工逐一阅读,这是一个需要大量时间和精力的过程,因此,需要自动化的产品评论挖掘来更快地从大量的用户评论中获取信息。产品评论大多用自然语言进行

3、描述,生产厂商和用户只有采用人工阅读的方式才能从中提取信息,而这是一个费时、费力且容易产生错误的过程,因此,产生了自动产品评论挖掘的需求。产品评论挖掘一般分为产品特征提取、主观句定位和用户词性判断和挖掘结果显示等4个阶段。产品特征提取作为产品评论挖掘的第1个阶段,目的是从众多的用户评论中挖掘出用户所关心的产品特征,从而对实际产品销售和售后服务做出正确的评价,帮助决策者和购买者能够最大限度的了解现有产品的特点和特征。1.2选题意义找出用户最感兴趣和最希望提供的功能,从而改进产品。用户购买产品之前可以了解已经购买了该产品的用户关于该产品的使用体验,了解产品各个方面的性能,还可以对同类型的产品按

4、照性能进行比较,从而合理的购买产品。产品特征提取目的是从众多的用户评论中挖掘出用户所关心的产品特征(比如:相机的产品特征包括重量、大小、图片的质量、电池的使用时间、存储容量等;手机的产品特征包括制式、重量、体积、屏幕大小、摄像头像素等)。由于角度不同及用户通常使用一些常识性描述,生产厂家所使用的产品功能和不见特征名称与用户所表达出来的有很多是不一样的,主要对厂家产品的规格特征和用户描述特征提取及其关系进行了研究。28重庆科技学院本科毕业生论文1绪论抽取出产品特征之后就着重于研究用户对某个产品特征的看法,即在一个表达了用户看法的主管句中提取出产品特征、极性词汇及程度,在现有研究的处理过程中,

5、对产品特征并未进行归类处理,所有的特征地位都是等同的,故本来处于上下位的特征可能放在不同的表示中,这样就造成用户看到的是没有主次之分的特征,同时有些本是同一特征的不同表示方法,却归纳到不同的特征中去,这种情况下虽然对某些特征进行了评价,但由于使用哪个不同的词语作为产品特征,结果对同一部件的评价放在了不同的展示中,这样展现给用户的是很多没有主次之分特征堆积。摩托罗拉A1890(MOTOA1890)天翼3G双网双待手机的评论如图1.1所示:图1.1摩托罗拉A1890(MOTOA1890)天翼3G双网双待手机评论在这种情况下,对产品特征之间的层次关系合理且准确处理的要求,就显得非常急迫,本课题应

6、运时势,对产品特征进行分层次的特征抽取。1.3从评论语料库中挖掘产品特征词的研究现状产品评论挖掘需要了解用户对产品的哪些功能、性能进行了评价,因此需要从产品评论语句中提取表达了用户评价的对象——28重庆科技学院本科毕业生论文1绪论产品特征。产品特征提取的目的是发现用户在产品评论中对哪些产品特征表达了自己的看法。用户在产品评论中对特征的描述是一个开放性的问题,可能在产品评论中发表厂家根本没有考虑到的一些性能,因此挖掘出产品评论中所提及的特征,了解用户对这类产品最关心的功能及性能是很重要的。由于同类产品的特征基本一致,故可以利用产品特征对同类产品所获得的评价进行对比。产品特征的提取分为人工定义

7、和自动提取两类。在人工定义方面,Kobayashi、Inui和Matsumoto以人工定义方式提出了针对汽车的产品特征,建立了287个产品特征,每一个特征使用一个三元组进行表示(),其中subject表示产品,attribute表示产品的特征,value表示对这个特征的观点;姚天昉利用本体建立了汽车的产品特征,该系统可在电子公告板、门户网站的各大论坛上挖掘并且概括意见持有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。