信息检索中语义的分析技术和文本相似度模型的研究

信息检索中语义的分析技术和文本相似度模型的研究

ID:32527768

大小:5.06 MB

页数:62页

时间:2019-02-11

信息检索中语义的分析技术和文本相似度模型的研究_第1页
信息检索中语义的分析技术和文本相似度模型的研究_第2页
信息检索中语义的分析技术和文本相似度模型的研究_第3页
信息检索中语义的分析技术和文本相似度模型的研究_第4页
信息检索中语义的分析技术和文本相似度模型的研究_第5页
资源描述:

《信息检索中语义的分析技术和文本相似度模型的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、UniversityofScienceandTechnologyofChinaAdissertationformaster’SdegreeResearchonSemanticAnalysisandTextSemanticmodeIInlnformationRetrievaIAuthor’SNameZhijunSunSpecialityNetworkCommunicationSystem&ControlSupervisor:AssociateProf.QuanZheng⋯11‘Plnlsnedtime:May10m,2012中

2、国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文巾不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文rfl作了明确的说明。作者签名:签字目期:a£0。笸:』中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进

3、行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。讼开口保密(——年)作者签名:乏坌查塾签字日期:玉强。笸.r翩躲扭签字日期:刁幻12.百.)--摘要在信息检索领域rfl,传统的文本检索方式一直是搜索引擎的关键技术。然而随着用户要求的不断提高,文件检索技术的诸多问题逐渐成为了信息检索技术的发展瓶颈,例如计算机对用户查询语句的理解与用户真实查询意图之间差异的问题。为解决这样的问题,本文试图通过语义分析技术抽取文本背后的语义信息,并结

4、合原有的信息检索评分公式给出了计算文本语义相似度的相似度计算模型,提高语义检索的效果。希望通过计算文本之间语义的关联,以替代传统的单纯地通过关键字匹配技术,达到提高信息检索质量的目的。本文在前人的研究成果之上,针对语义检索和语义分析的一些问题,给出了基于句型识别的语义分析方法,同时在原有的相似度计算模型的基础之上做出改进,实现文本语义相似度计算功能。具体的工作有,第一、在原有的语义分析技术基础之上,结合汉语旬式繁多语法结构复杂等特点,给出了基于句型识别方式的语义分析方法。本文试图在语义分析过程中,以对汉语语句句型的评判为依据

5、,提取文本的语义信息。第二、针对文本语义信息的特点,给出了描述语义信息的结构。采用语义图的方式表示汉语语句的语义,其中语义图的片段由一种“n元组”的结构表示。第三、依托原有的信息检索相似度模型,给出了计算文本之间语义相似度的相似度计算模型。由于语义信息结构相对复杂,同时具备层次结构,所以需要对原有的评分公式做一些调整,以适应本文的要求。第四、针对本文给出的语义检索思想,完成相关技术的实现和实验仿真。目前,实验室的项目已经完成,本文给出的语义检索的思想也被应用到该项目中,系统能够正确地进行语义分析以及索引和检索操作。本文在查全

6、率和查准率上较传统的文本检索方式效果均有所提高,但主要体现在简单句式上,对于复杂的句式如复合句效果并不明显。但由于现代汉语中简单句式占的比重较大,本文给出的技术在提高信息检索效果上还是很有帮助的。关键词:语义:句型识别;相似度;Lucene原书空白页不缺内容ABSTRACTInthefieldoflnformationretrieval.traditionaltextretrievalmethodhasalwaysbeenthekeytechnologyinsearchengine.Meanwhile,astheincrea

7、singofusers’requirements,thebottleneckinthetechnologyofinformationretrievalalsoresultsfromproblemsbroughtbytextretrieval.Differencebetweencomputer’Sunderstandingofusers’querysentencesandusers’queryintensionsisaspecificexample.Toaddresssuchproblems,wetrytoutilizesem

8、anticparsingtechnologytoextractsemanticinformationhiddenbehindthetextandgiveoutasemanticsimilaritycalculatingmodelbasedonLuceneratingformulainthi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。