数据标准化与随机游走下的语义关系相似度计算

数据标准化与随机游走下的语义关系相似度计算

ID:32072807

大小:4.91 MB

页数:55页

时间:2019-01-31

数据标准化与随机游走下的语义关系相似度计算_第1页
数据标准化与随机游走下的语义关系相似度计算_第2页
数据标准化与随机游走下的语义关系相似度计算_第3页
数据标准化与随机游走下的语义关系相似度计算_第4页
数据标准化与随机游走下的语义关系相似度计算_第5页
资源描述:

《数据标准化与随机游走下的语义关系相似度计算》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、复旦大学硕:1:学位论义AbstractAbstractItisanimportantresearchtopictomeasurethesemanticrelationalsimilaritybetweentwowordpairs,whichhasgreatvaluesinapplicationssuchassemanticsearch,informationextraction,analogydetectionandontologyconstruction.Theexistingmethodstomeasuringrelationalsimilaritycanb

2、eroughlydividedintotwocategories:theonebasedonsemanticresources(suchasWordNet),andtheotherbasedonlarge-scaletext(whichisnormallystatistical).Thestatisticalmethodsbasedonlarge-scaletextcorpusfirstextractrelatedlexical/syntacticpatternsaccordingtothecontextswherethewordpairco-occur,then

3、calculatethefrequenciesofthoseextractedpatternsbetweenthewordpair,andfinallyderiveouttherelationalsimilaritybetweendifferentwordpairs.Thiskindofmethodsoftensuffersfromtheproblemofdatasparsity.Thispaperhasanalyzedandsummarizedtheprocessingflowsandkeytechniquesusedbyclassicalmethods,and

4、hasdonethefollowingwork:Firstly,duetothefactthatdatastandardizationtechniqueplaysanimportantroleinrelationalsimilaritymeasurement,thispaperstudiedtheapplicationofthreedifferentdatastandardizationmethods(theintervalstandardization,thezScorestandardization,andtheentropy-weightedstandard

5、ization),andevaluatedtheireffectivenessontheENTdatasetandtheSATanalogiesquestions.Secondly,sincethestatisticalmethodsbasedonlarge-scaletextcorpusoftensufferfromtheproblemofdatasparsity,weemployedtherandomwalkalgorithmtosolvetheproblem,whichwasalsotestedandanalyzedbyexperiments.Finally

6、,thispaperproposedaprocessingflowtointegratetheautomatictermrecognitionandtherelationalsimilaritymeasurement,whichprovidesamechanismforautomaticacquisitionofwordpairs.Keywords:Semanticrelationship,Semanticsimilarity,Datastandardization,Randomwalk,Automatictermrecognition.Classificatio

7、nCode:TP391.1复旦大学硕:I:研究生学位论文第一章绪论第一章绪论如今互联网信息飞速增长,面对如此海量的信息,如何自动获取并蹄选更贴近人们所需的信息是知识发现领域的重要课题,而在词对语义关系相似度方面的研究更是重中之重,它在关系提取、信息检索、类比检测、查询扩展、问答系统和本体网络构建等领域都有着广泛的应用。近年来,针对词对间语义关系的研究取得了巨大的突破。本文主要针对英语词对之间蕴含的语义关系的相似度度量的问题进行探索,同时将已有的算法理论和词对间蕴含的语义关系相似度度量问题的一些特质相结合提出了解决该问题的新方法。1.1研究背景词是词对的基本单元,

8、而词对则是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。