基于句法分析和主题建模细粒度观点挖掘模型的研究

基于句法分析和主题建模细粒度观点挖掘模型的研究

ID:31976862

大小:12.47 MB

页数:84页

时间:2019-01-29

基于句法分析和主题建模细粒度观点挖掘模型的研究_第1页
基于句法分析和主题建模细粒度观点挖掘模型的研究_第2页
基于句法分析和主题建模细粒度观点挖掘模型的研究_第3页
基于句法分析和主题建模细粒度观点挖掘模型的研究_第4页
基于句法分析和主题建模细粒度观点挖掘模型的研究_第5页
资源描述:

《基于句法分析和主题建模细粒度观点挖掘模型的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江大学硕士学位论文删㈣㈣㈣朋Y22814否百‘随着互联网的快速发展,网络评论呈现出爆炸式增长的趋势,已经成为挖掘消费者对产品或服务情感倾向的一个极具价值的资源。网络评论中的观点表达存在很大的灵活性和复杂性,丽传统的观点挖掘方法则普遍存在挖掘粒度过大、无法有效地理解自然语言等不足。针对这些问题,提出两个基于句法分析和主题建模的细粒度观点挖掘模型,用于自动地从网络评论中挖掘领域特征词和观点词。首先,提出一种基于依存分析(Dependencyanalysis)的无监督方法来自动抽取评论中的评价表达模式(App

2、raisalExpressionPaaem,AEP)。AEP用于表示领域特征词和观点词之间的语义关联,它是一种语言表达层面的与领域无关的语义信息,具有良好的领域适用性。其次,提出一种基于AEP的改进潜在狄利克雷分配(LatentDirichletAllocation,LDA)模型DLDA。DLDA模型是一个句子级别的概率产生式模型,它假设评论数据集由多个一一对应的领域主题和情感主题以及一个背景词主题组成。DLDA充分利用了AEP信息,实现了对领域特征词和观点词同步且高准确率地挖掘。然而,DLDA模型仅能够

3、使用AEP信息,无法充分利用其他特征维度,因此具有较弱的特征可扩展性。最终,提出了基于最大熵模型(Maximumentropy)的改进DLDA模型,MLDA。MLDA是一个有监督的概率产生式模型,利用最大熵模型它可以融合多个句法特征,具有较强的特征可扩展性,但MLDA模型需要手工标注数据。论文在酒店、餐馆、MP3、数码相机领域进行了实验与对比分析。实验表明,DLDA在领域特征词提取、观点词提取、领域适用性方面均优于对比的无监督主题模型算法。而作为有监督的MLDA模型,在领域特征词抽取上亦优于经典的有监督算

4、法。关键词:观点挖掘,情感分析,评价表达模式,依存分析,主题建模浙江大学硕士学位论文AbstractWiththeconsiderablegrowthofweb2.0.reviewshavebecomevaluablesourcesforminingcustomers’opinions.Expressingopinionsthroughonlinereviewshasagreatdealofflexibilityandcomplexity.However,mostofthetraditionalopini

5、onminingmethodsarecoarse-grainedandcannotunderstandthenaturallanguage.Tosolvetheseproblems,thispaperpresentstwofine-grainedopinionminingmodelsbasedonsyntacticanalysisandtopicmodeling.Themodelsstudytheautomaticextractionofproductandserviceaspects,aswellast

6、hesentimentwordsfromreviews.First,anunsupervisedapproachispresentedforextractingtheAppraisalExpressionPatterns(AEP)fromthereviews.AEPrepresentthesemanticrelationshipsbetweenaspectsandsentimentwords。Theyarehigh·levellanguage—dependenttypesofsemanticinforma

7、tionandhaveexcellentdomainadaptability.Second,anAEP-basedLatentDirichletAllocationmodel(DLDA)isproposed.DLDAisasentence-levelprobabilisticgenerativemodel.Itassumesthateveryreviewdatasetiscomposedofseveralmutuallycorrespondingdomainandsentimenttopics,aswel

8、lasabackgroundwordtopic.TheDLDAmodelcanuseAEPinformationtosimultaneouslymineaccurateaspectsandsentimentwords.However,itusesonlyAEPandcannottakefulladvantageoftheotherfeatures,thus,ithaspoorscalability.Finally,aMaxim

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。