基于评论信息的内容感知方法研究.pdf

基于评论信息的内容感知方法研究.pdf

ID:50430682

大小:2.66 MB

页数:76页

时间:2020-03-06

基于评论信息的内容感知方法研究.pdf_第1页
基于评论信息的内容感知方法研究.pdf_第2页
基于评论信息的内容感知方法研究.pdf_第3页
基于评论信息的内容感知方法研究.pdf_第4页
基于评论信息的内容感知方法研究.pdf_第5页
资源描述:

《基于评论信息的内容感知方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA®i±~f}ii~)(MASTERTHESIS201221060102*A~~m¥~~~Q~~~*A~~~m~~~fr~~~I~&~~~~~~*o•ftm~,~T~~~m~~~tt~ftW~~~*'~~~~§*~~AB~£~~-~tt~~~~*'~~~*~~~~TWtt*~~~E~~m~~~~~~~W~fflrl~~Mo~~~~I~~~~~*~~m-~ffW~~~Bfr~X~~T~~~tl=i'r~~:){J.

2、_i~=tffJDjfft*~~~x~*~~7M~rW~*~fl~~m,~m~~~x~~~,~~§M#~OO*~~sn•m~*~~~~~$#~aA,ftiCfit~)(j_&ft151J*oftlf15?1o*A~~ft!Tl41i::k~PItVAtt~tLi-a3C1¥.1~$~$~~~~A~~--~-ff~•,~~*m~~,~~~~m~~1tltl-¥Rf*if,n:~?¥:&~1Co(~W~~&~Xft~*~~~~~~~)分类号密级注1UDC学位论文基于评论信息的内容感知方法研究罗熹指导教师秦志光教

3、授电子科技大学成都申请学位级别硕士专业名称信息安全论文提交日期2015.03论文答辩日期2015.05学位授予单位和日期电子科技大学2015年6月29日答辩委员会主席评阅人注1注明《国际十进分类法UDC》的类号RESEARCHONCONTENTAWAREOFREVIEWAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:InformationSecurityAuthor:XiLuoAdvisor:Zhi

4、GuangQinSchool:SchoolofInformationandSoftwareEngineering摘要摘要Web2.0和电子商务的流行带来了大规模的用户评论数据。如何从这些分散的数据中找到并整理出用户想要的信息是学术界研究的热点。不管是web2.0还是电子商务带来的评论,用户最终的目的都是了解之前用户的情感倾向。情感倾向分析即分析用户在评论中所表达观点的倾向性。在情感分析中的展现只是用户对于店铺的倾向性判断。而内容感知对评论进行分析提取,得到用户关于店铺的具体的特征的描述,能够呈现给用户店铺倾

5、向性判断的原因。本文在内容感知上所从事的工作主要是三个方面。首先是提取评论中的特征词。特征词指能表现店铺特征的词语如味道、环境、服务等等。其次是寻找评论中的观点词。观点词指作者对应餐饮店铺特征的具体评价如优劣、好坏、甜辣等。最后是将特征词和观点词匹配起来。匹配指特征词只能跟特定观点词搭配。对于内容感知上述的三个方面的工作,我们提出了一种混合方法来进行实现。混合方法由两部分组成:在中文领域构建的语言规则集和餐饮知识库。语言规则主要集中在常识性的语言习惯,作者通过将评论进行词性分析后的组合形式进行分类总结,将如

6、何从词性组合中提取特征观点词抽象为语言规则集。因此语言规则集可以直接移植到其他的特定领域而不需要做大的改动。餐饮知识库的构建则主要通过传统的tf-idf方法提取特征词,爬虫提取低频菜名特征词,语言模式提取词与词共同出现的信息。知识库拥有餐饮领域的特点。但是在原型系统中它是作为一个模块单独存在,当我们将方法进行移植或者运用于其他评论领域时,它并不会影响到整个原型系统的兼容性。根据实验结果评测表明我们提出的方法取得了很好的结果。实验数据来自于大众点评网的餐饮评论。通过与经典的邻近形容词算法以及基于规则的提取算法

7、对比,实验结果都有明显的提高。本文提出算法提取观点的f-score平均值为66%,平均准确率为55%,平均召回率为83%。相关的工作已经刊出发表。关键词:评论分析,语言规则,知识库,观点提取,内容感知IABSTRACTABSTRACTDuetothedevelopmentofweb2.0ande-commerce,thereisatremendousriseofproductreviewsprovidinginsightsformerchants.Thealgorithmthatprocessesusefu

8、linformationfromreviewshasbecomearesearchhotspot.TheuserEtailerswanttoknowaboutthesentimenttendencyofprevioususerEtailerslikelyinferringcustomers’preference/tendency.Sentimentanalysisalgorithmistogetthetenden

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。