欢迎来到天天文库
浏览记录
ID:35153661
大小:3.93 MB
页数:164页
时间:2019-03-20
《基于近似文本分析的意见挖掘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、上海大学博士学位论文基于近似文本分析的意见挖掘姓名:刘健申请学位级别:博士专业:控制理论与控制工程指导教师:吴耿锋20070101摘要本文对如何将部分解析技术引入意见挖掘,以提高分析的有效性问题进行了研究,其成果概括如下:(1)提出了基于部分解析的壑解析方法及其增量式实现近似文本分析(ATA)(见第2章).超解析通过放宽归约的严格程度(即允许非紧邻的成份进行归约,允许一个语言成份参与多个归约关系),从而最大限度地寻找关于给定文本(或文本片段)的各种可能解释.为了优化归约时对有效语言成份组合穷举的过程,提出了
2、候选者队列算法(cLA).作为超解析的实现,本文提出近似文本分析,其系统由两部分构成:分析部件与广义归约部件.分析部件以缓冲队列作为核心的数据结构,从而将超解析的问题转化为了广度优先的搜索问题.而广义归约部件是CLA算法的增量式实现,负责语言成份的归约.(2)提出了基于“近似文本分析”的情感分类方法ATA-SC,及其软件实现—ATAF—ilter(见第3章).ATA-SC方法考虑了实体词汇与情感词汇之间的语义关联,因此对于情感的识别能力要强于基于单对象假设的情感分类方法.而情感分类模块ATAFilter已集
3、成于邮件过滤软件VIHunter中,在技术测试中展示了良好的性能,同时在实际应用中也获得令人满意的效果,取得了较好的社会效益.(3)提出了一种新的意见抽取任务即重墨壅型垫壑fQ!璺,及其解决方法VVI中文摘要野羔Ql曼;提出了基于位置线索的语义关系识别(sARPc)方法,用于在FC.OIE中识别对象与特性之间语义关联(见第4章)。意见实例抽取任务的目标是保持意见表达的数据结构与源文本之问的关联,使得我们可以通过考察意见元组中各构成要素在原文中的地位,来发掘更深层次的信息.为了解决这一新的抽取任务,FC—OI
4、E采取的策略是:通过SARPC方法为每个特性实例寻找语义关联最强的对象实例,构成“对象实例一特性实例”对偶;对于每个对偶,通过ATA.Sc对所含的对象实例与特性实例周围的文本进行情感分析,判断语义方向.(4)提出并实现7用于意见实例抽取与检索的意见搜索系统(oss)(见第5章).OSS的目的是从网络评论中抽取意见实例,并根据用户的检索兴趣进行反馈.该系统通过网络爬虫从互联网上抓取评论网页,通过文本清洗得到正文;然后以FC-OIE技术从文本中抽取意见实例,构成意见库:最后通过人机交互将意见库中的信息直观地反馈
5、给系统的用户.关键词:部分解析,情感分类,近似文本分析,意见抽取,意见挖掘AbstractInthispaper,in-depthresearchonpromotingtheeffectivenessofsentimentanalysisinopinionminingbymeaJl8ofpartialparsngisdescribed.Theachieve-mentsofthepaperare够follows:(1)Apartial—parsing-basedmethodanditsincrementali
6、mplementationarepro-posed.ThenewparsingmethodisnamedSuperParsing,whosepurposeistoseekallthepossibleinterpretationforagiventext(ortextsegment)byrelaxingtheconstraintsonreducing.Itallowsnon-adjacentconstituentstobemerged,andallowsoneconstituenttojoinmultiple
7、reductionrela-tions。Tooptimizetheenumeratingprocessofeonsitutentcombinations,theCandidateListAlgorithm(CLA)isproposed,ApproximateTeztAnalysis似TA)istheincrementalimplementationofSuperParsing.Itconsistsoftwoparts:AnalyzingComponentandGlobalReductionComponent
8、.AnalyzingComponenttakesthebulterqueue∞coredatastructure.whichconvertstheSuperParsingproblemintotheBreadth-firstSearchingproblemWhileGlobalReductionComponentistheincrementalimplementationofCLAforconstituentre
此文档下载收益归作者所有