欢迎来到天天文库
浏览记录
ID:32258715
大小:2.39 MB
页数:58页
时间:2019-02-02
《中文商品评论文本情感的分析技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代号:10532学密号:G12245176级:普通湖南大学工程硕士学位论文中文商口;币口口旰论的文本情感分析技术研究雯僮虫请厶姓名i奎挂倦墙羞望僮!鱼星型堂皇王猩堂医童些各整!筮住王狸迨窒逞窒旦翘;至Q!§生里旦2至旦途窒簦拦旦期;2Q!墨玺璺旦22旦ResearchofSentimentAnalysisforChineseProductReviewsbyLILinqiaoUniversitydiploma(RadioandtelevisionUniversity)2006Athesissu
2、bmittedinpartialsatisfactionoftheRequirementsforthedegreeofMasterofEngineeringSoftwareEngineeringintheGraduateSchoolofHunanUniversitySupervisorAssociateProfessorHujunSeniorElectricalEngineerXieXiangdongMay,2015湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行
3、研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:哆喜司夺≮曳日期:知g年9月/矿19学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以
4、采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于l、保密口,在年解密后适用本授权书。2、不保密回。(请在以上相应方框内打“√”)日期:.V≮年日期:抄6年钼细硼伽月月阳尹糸自锰婚歹争I,确互l躲铺签签者师中文商品评论的文本情感分析技术研究摘要互联网技术的快速进步,使得电子商务网站得以飞速发展,越来越多的人们通过网络平台来获取商品评论信息,并根据评论信息来指导消费。对这些以指数级增长的评论信息,若能对其进行挖掘及相应的分析,辨别出其中的情感倾向,则不仅可了解用户对商品的满意度及意
5、见,而且也可为商家的决策提供参考,进而提高商品质量及服务态度。本文首先介绍了中文文本情感分类流程及相关核心技术,然后分别从商品评论的获取、商品评论情感分析方法两个方面进行了相关分析与研究。其中,对商品评论的情感分析,本文分别采用了基于机器学习的方法及基于情感词典的方法。对评论进行情感分析,首先需要从相应购物平台中获取相应的语料数据,不同商品类别的评论通常集中在某一板块,且网页呈现出高度的结构化。基于此,本文使用了网络爬虫对网页进行实时处理并获取评论信息,从而得到供情感分类用的评论数据。然后,本文
6、分别基于两种不同的思想对评论进行情感分析。在基于情感词典的方法中,构建了一个较为完整的面向商品评论信息的情感词典,其中,基础情感词典采用知网发布的“情感分析用词语集”,而网络情感词典则主要基于已有的不完整的网络词典,通过评论信息来收集并进行标注,以此来扩充该网络情感词典。并通过SO.PMI算法对词语的情感倾向性进行计算,以此对情感词典进行扩充。最后,根据短语结构,对评论信息中的情感特征词进行情感倾向加权求和,从而获得整个评论的情感倾向及强度。在基于机器学习的方法中,构建了贝叶斯分类模型,并提出了
7、一种混合特征提取方法,有利于分类特征的保留,并对冗余特征进行删除,进而提高情感分类效果。最后,从天猫上采集数码、服饰、食品、图书四个类别的评论信息作为实验测试语料,对本文中的两种方法进行了对比实验分析。实验结果表明两种方法均是可行的,而基于机器学习的方法在分类效果上要略优于基于情感词典的方法。关键词:商品评论;情感分析;文本分类;特征提取;情感词典工程硕士学位论文AbstractRapidadvancesofInternettechnologymakinge—commercewebsitesde
8、velopfast,moreandmorepeoplegettheproductreviewsthroughthenetworkplatformandguideconsumptionbasedontheseinformation.DataminingandcorrespondinganalysistotheseexponentialgrowthofinformationforidentifyingtheemotionaltendencycannotonlyhelpUSunderstandtheu
此文档下载收益归作者所有