欢迎来到天天文库
浏览记录
ID:35040844
大小:7.05 MB
页数:73页
时间:2019-03-16
《互联网商品评论信息的情感分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、郎代料;分类号密级:公巧革UDC.:0046学号:1315巧,一;,户’ ̄抑圓—"1—*-*g^:g苗山g化*^j—■—??3g,I扣I"心f刪;’,;而巧ilted:l狼.東禹大嗦巧工程硕±学位论文互联网商品评论信息的情感分析研究学位论文形式:应用研究)研究生姓名:张责林导师姓名:姜浩李国锋申请学位类别工程硕±学位授予单位东南大学工程领域名称计算机技术论文答辩日期2016年05月31日研究方向计?机应用技术学位授予日期2016年月日答辩委贸会主席
2、徐立揉评阅人2016年6月2円袭兩未哨硕±学位论文互联网商品评论信息的情感分析研究:专业名務;计im巧术(专业学位)研触姓名:张贵林导师姓名:mt李国鋒ResearchonSentimentAnalysiswithInternetProductReviewAThesisSubmitedt:oSoutheastUniversityFortheAcademicDegreeofMasterofEnineeringgBYGuilinZhangSuervised
3、bpyAssociateProf.HaoJiangandSNENG民.GuofenLigSchoolofComputerScienceandEngineeringSoutheastUniversityMa2016y东南大学学位论文独倒性库明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构一的学位或证书而使用过的材料。与我同工作的同志对本研巧所
4、做的任何贡献均己在论文中作了明确的说明并表示了谢意。:研巧生签名:味日期楚每东南大学学位论文使用授奴巧明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位、论文的复印件和电子文档,可W采用影印缩印或其他复制手段保存论文。本人一电子文档的内容和纸质论文的内容相致。除在保密期内的保密论文外,允许论,可Ui文被查阅和借阅■公布(包括W电子信息形式刊登)论文的全部内容或中、英文摘要等部分内容。论文的公布(包括电子信息形式刊登)授权东南大学研究生院办理。研究生签名泌整遂#师签名:斗曰期:^摘要,越
5、来越多的人们习惯网络购物随着互联网与电子商务的迅速发展,与此同、时,大量的互联网商品与商品评论信息对于人们选择合适的性价比高的商品造一成了定的困扰。由此,对互联网商品评论信息进行情感分析显得尤为重要。针对互联网商品领域进行的情感分析,W某种网络商品的评论内容为样本,利用机器学习等方法自动分析其情感倾向,发现人们对于该商品的褒贬意见和态度。本文的研充课题是互联网商品评论信息的情感分析研究,主要目的是利用计,算机技术分析网络产品中大规模的评论文本得出其情感倾向性,在方便消费者选择合适的产品的同时,也帮助商家对产品有更好的了解和改善。论文主要
6、从W下几个方面展开研充工作。1.完成互联网商品情感分析的预处理工作。选取某电商网站上相关电子产品。作为研巧对象,通过数据堂下载商品的评论数据对获取的评论数据进巧文本的预处理王作,主要包括文本的中文分词、过滤、词性标注、数据清洗、数据分类等,为后续评论文本的情感分析做准备。一2.选取最优词性特征并提出种改进的基于正负相关比率的互信息特征选择方法。特征的选取对情感分类起着决定性的作用,选取合适的特征有利于提高一情感分类的准确率。方面,从词性特征考虑,针对不同的文本特征主要包括情感词、形容词、副词、动词从及情感语气词等,指出情感语气词
7、对于情感分类具一有较好的辅助作用,选取最优词性特征组合。另方面,对于特征选择方法进行比较一,指出传统互信息选择方法的不足之处,并提出种改进的基于正负相关比率的互信息特征选择方法。通过实验表明本文提出的最优词性特征组合W及改进的互信息特征选择算法具有更好的分类性能。3H支决策的理论并提出一.分析种多决策加权混合分类器。H支决策在处理一不确定性问题时具有更好的表现。基于H支决策思想本文提出了种多决策加权混合分类器,给出其主要思想、相关规则及定义。分别使用朴素贝叶斯分类器和支持向量机分类器,进行两次H支决策,对于边界,设置各个分类器的
8、最优阔值区
此文档下载收益归作者所有