基于中文在线评论的产品特征提取与情感分析研究

基于中文在线评论的产品特征提取与情感分析研究

ID:35059592

大小:6.82 MB

页数:67页

时间:2019-03-17

基于中文在线评论的产品特征提取与情感分析研究_第1页
基于中文在线评论的产品特征提取与情感分析研究_第2页
基于中文在线评论的产品特征提取与情感分析研究_第3页
基于中文在线评论的产品特征提取与情感分析研究_第4页
基于中文在线评论的产品特征提取与情感分析研究_第5页
资源描述:

《基于中文在线评论的产品特征提取与情感分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、'分类号:^裝妥密级:公巧/.,UDC.:0044--.4&S学号:」imi_……’.tnTi…?uT"…?…■了T广"3!邊r>!瑚據J讀#紙?-H東4f呼It硕±学位论文基于中文在线评论的产品特征提取与情感分析研究研究生姓名:周立凤导师姓名:吴含前申请学化类别工学硕±学位授予单位东南大学一级学科名称软件工程论文答辩日期2016年4月01日二级学科名称软件工程理论与实战学位授予日期答辩委员会主席

2、姚莉阅人姚前评汪鹏20年月曰硕±学位论文基于中文在线评论的产品特征提取与情感分析研究专业名称:软件工程研究生姓名:周立凤导师姓名:吴含前RESEARCHOFPRODUCTFEATUREEXTRACTIONANDSENTIMENTANALYSISBASEONCHINESEONLINEREVIEWSADissertationSubmittedtoSoutheastUniversityFortheAcademic

3、DegreeofMasterofEngineeringBYLifengZhouSupervisedbyHangianWuSchoolofComputerScienceandEngineeringSoutheastUniversity东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研充成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研巧成果,也不包含为获

4、得东南大学或其它教育机构的学位或证书而使用过的材料一。与我同工作的同志对本硏巧所做的任何贡献均已在论文中作了明确的说明并表示了谢意。休K研巧生签名;间曰期;东南大学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电、子文鞋,可W采用影印缩印或其他复制手段保存论文。本人电子文摆的内容和纸质论文的内容相一,致,允许论文被查阅巧借阅可W公布(包括刊登)论文的全部或。除在保密期内的保密论文外部分内容(包括刊登)授权东南大学研究生院办理

5、。。论文的公布頂心詞研苑生签名:导师签名:寒曰期;Wk心b^摘要随着互联网应用的普及及电子商务的迅速发展,网络购物已经成为人们普遍且重一要的消费方式,它们是用户在网上。在线评论是电子商务网站上的个重要的数据资产购买产品后对产品发布的包含个人主观或者客观的态度及意见的文本集合,这些评论数据为网购用户和商家提供了巨大的潜在价值。海量的在线评论依靠人工阅读理解显然无法实现一问题提供了有效的解决手段并成为了国内外学,评论挖掘技术的出现为解决这者研究的热点。评论挖掘主要研究内

6、容包含特征提取和情感分析两部分,本文围绕中文在线评论挖掘的研究:,开展了如下工作1)构建电子产品领域的中文在线评论资料库。本文利用定制化的爬虫工具来自动化抓取京东和淘宝的关于电子产品评论的html内容,并进行解析,然后采用本文提出的初始评论过滤标准对原始评论数据进行过滤和清洗,采用中科院分词工具进行分词,去停用巧后,统计词频存入到数据库中,最后将经过预处理的数据存入ES集群中。2一)提出种高效的基于中文在线评论二次剪枝算法来进行特征提取。本文在传统SP的序列模式挖掘算法的基础上

7、,针对其准确率和召回率不够高的问题,将传统G算法与基于统计基础的词对共现度方法进行结合,实现特征的提取和剪枝,得到的特征集合为后续的情感分析工作奠定基础。3)中文句法模式的构建。本文采用句法分析器对评论进行句法解析,而后统计各个依存关系在语料库中的频率,通过对依存模式的研究,结合在线评论的特征,构建了7一个依存模式,并提出了个基于语义距离和标点的提取算法来提取特征及观点组成的元组。一11最后,本文构建了个基于个特征的分类特征模型采用SVM、逻辑回归和贝,并,叶斯算法作为分类

8、器,与基线模型进行多个实验比较。通过对特征的筛选和排序本文5最后获得了个与分类结果最相关的特征,实验结果表明了本文的方法的有效性和易用性。:关键词评论挖掘;特征提取;情感分析;依存模式;分类特征模型IAbstractAbductW脯也edevelomentofInternetalicationsonineshoinsradualcomina打ppp,lppgiglybegi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。