欢迎来到天天文库
浏览记录
ID:35060758
大小:3.53 MB
页数:72页
时间:2019-03-17
《基于依存关系的语义表示方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于依存关系的语义表示方法研究RESEARCHONSEMANTICREPRESENTATIONSBASEDONDEPENDENCYRELATION刘琴2016年7月国内图书分类号:TP391学校代码:10213国际图书分类号:004密级:公开工学硕士学位论文基于依存关系的语义表示方法研究硕士研究生:刘琴导师:陈清财教授申请学位:工学硕士学科:计算机科学与技术所在单位:深圳研究生院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391U.D.C:004DissertationfortheMaster’sDegreeofEngineeringRE
2、SEARCHONSEMANTICREPRESENTATIONSBASEDONDEPENDENCYRELATIONCandidate:QinLiuSupervisor:Prof.QingcaiChenAcademicDegreeAppliedfor:MasterDegreeinEngineeringSpeciality:ComputerTechnologyAffiliation:ShenzhenGraduateSchoolDateofDefence:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工
3、学硕士学位论文摘要随着统计自然语言处理的出现,在文本处理领域,我们需要将自然语言描述的文本转换为一种可计算的数据结构。如经常使用向量来表示一个词,向量在某个维度上的值表示了词在某一种语义或语法上的特征的权重。词向量在衡量词语之间相关性的计算上有重要作用,且广泛用于其他一些基础自然语言处理任务,如文本的情感分析,文本聚类、分类,命名实体识别等。分布式语义表示模型是一种常见的词语表示方法,获得了广泛的认可。分布式语义模型隐含的做了一个词袋假设:一个单词语义与它相邻的其他单词息息相关,但是忽略词语出现的位置和句法语义关系。针对分布式语义模型忽略了词语间的语义关系的问题,我们提出了一种基于分布语义模型
4、的扩展模型,合并了分布式语义中的结构,主要通过词语在句法依存关系中的分布来表示词义,每个词语被表示成一个矩阵,矩阵的每一行是词语基于每个依存关系的分布向量。同时,针对这种词语表示方法,提出了一个新的语义组合方式,与传统向量混合方式相结合可以用来表示短语、句子等更大组合结构的语义。在实验中,我们选择维基百科上的英文数据约11G作为我们的数据源。经过预处理后,选择了4000万条完整的句子作为训练集,最终通过四个相关评测任务,验证基于依存关系语义表示模型的有效性。本文提出的方法在WS–353数据集上做词对相似度评分任务,结果为0.6548;用TOEFL-80作为同义词候选评测的测试集,准确率为0.8
5、53;在短句相似度评测中Spearman系数为0.5004;在词对关系分类任务上的结果为0.492。实验表明基于依存关系的语义表示模型能够有效的表达词义,并且在通过一种新的语义的组合方法,可以较好的表达更大组合单元的语义。关键词:词语表示;分布式语义模型;结构语义模型;语义组合;依存关系-I-哈尔滨工业大学工学硕士学位论文AbstractWiththeemergenceofstatisticalnaturallanguageprocessing,intextmining,giveeverythingarightmeaningisthebasicwayofcommunicatingwithnat
6、ure.Weneedtoconverttextintoanumericaldatastructure,alwaysavector,torepresentaword.Eachdimensionofthevectorrepresentstheweightofasemanticorgrammaticalfeatureofaword.Thus,themeaningofawordinatextcontextisexpressedasmuchaspossible.Thesevectorscannotonlyexpressthecorrelationbetweenwordsefficiently,Atthe
7、sametimeitisthebasisofothernaturallanguageprocessingprojects.Suchaswordorsentence,textemotionanalysis,textclassificationorclustering.Thedistributedsemanticmodelhasbecomeapowerfulmethodtorepresentthese
此文档下载收益归作者所有