欢迎来到天天文库
浏览记录
ID:35053584
大小:6.15 MB
页数:52页
时间:2019-03-17
《在线评论中的产品属性提取及有用性识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、'乂连禮2?^大爹DALIANUNIVERSITY肿TECHNOLOGY破王享恆巧文MASTE民ALDISSERTATION在线评论中的产品属性提取及有用性巧别研究学科专业_管理科学与工程_____作者姓名f日月朕那曰萨教授指导教师20化年6月答辩日期硕±学位论文在线评论中的产品属性提取及有用性识别研究-Extractonndu-ProductFeatureiaUseflRecommendationforOnlineComments作者姓名:于明朕学科、专业:管
2、理科学与工程;21311013学号指导教师:那日萨L完成日期:20:5年4月10日夫么巧义夫緣DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中己经注明引用内容和致谢的地方外,本论文不包含其他个人或集体&经发表的研究成果,也不包含其他己申请学位或其他用途使用过的成果一。与我同王作的同志对本研究所做的贡献均巴在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法
3、律责任。,学位论文题目:在從i幸i么木巧^满底故才义^放斯則么1:,、別爲也■//年/月日作者签名:/化日期:兴^如大连理工大学硕±学位论文摘要随着近些年.0,互联网向着网站与用户之间双向互动的W纯2时代高速发展,在线评论这种非结构化文本数据迎来了爆发性的增长。这些数据中包含了大量的有用信息,是影响用户决策的重要影响因素之一,也是厂商家制定产品的研发和改进策略的主要依据。然而,由于在线评论数据量巨大,并且消费者往往具有不同的关注点与喜好,如何筛选出质量较高的在线评,并从在线评论中提取关于产品各方面属性的相关评价信息,
4、就显得格外重要。为了可W从在线评论中找到用户关注的产品信息一,本文提出了种基于互自扩展模。式的产品属性提取算法算法的核必思想是通过计算机自我学习,增量迭代达到理想效果-row。同时结合FPG化算法对该模式进行改进,使其不但可W无需人工标注种子库,从而避免算法结果的不确定性,而且可W提高自扩展模式中增量迭代的速度,获得更好一的扩展效果。为了降低自扩展模式下主题偏移的情况发生,又给出了种提取词、提取模式置信度的求解方法。为了克服中文分词、词性标注中出现错误提出了相似提取模,式和复合提取词的概念并给出了其挖掘方法,该方法能够在牺牲较少准确
5、率的情况下,。较好的提高召回率最后实验显示算法对中文在线评论中产品属性的提取效果,平均准-re为78确率为78.50%79.81%F.97%,平均召回率为,平均sco,取得了较好的提取效-果。对英文评论中的产品属性提取效果.,准确率为8022%,召回率为72.28%,Fscore7604%为.,相比较于文献中其它同类研究,在准确率上获得了较大的提升。基于上文所提到的产品属性提取算法而建立的产品属性数据库,考虑到通常用户在阅读在线评论时一,都对评论内容所包含的属性存在个也理预期,不同产品、甚至相同产品不同品牌之间,这些预期都是不同的。如果
6、评论可W满足用户预期,将会对用户认为评论是否有用产生重要影响。基于W上考虑,通过将在线评论有用性判别问题转化为文本分类问题,采用SVM支持向量机方法,利用开元的L化SVM软件实现文本分类器,结合其他学者的研究成果,提出九种特征值,实现了对评论有用性的机器识别。实验表明,对评论有用性的识别准确率平均在90.67%,验证了算法的有效性,同时也证明了用户也理预期的产品属性描述对用户评判在线评论有用性存在着较大的影响。本文研究成果可W为用户在线购物提供决策支持,为厂商家改善产品及服务提供理论依据,还能够促进电子商务平台完善在线评论系统,极具理论
7、与实践意义。关键词:在线评论;属性提取;互自扩展;评论有用性;支持向量机-I-在线评论中的产品属性提取及有用性识别研究--ProductFeatureExtractionandUsefulRecommendationforOnlineCommentsAbstractItt-strtnrecenearshe打0ucuredlexttteots;daahnlinecommenusheredinexlosivey,,pgrowthwiththerapiddevelopmentoftheW
8、eb2.0
此文档下载收益归作者所有