基于特征抽取和转换方法的全文检索研究

基于特征抽取和转换方法的全文检索研究

ID:36356298

大小:5.01 MB

页数:55页

时间:2019-05-10

基于特征抽取和转换方法的全文检索研究_第1页
基于特征抽取和转换方法的全文检索研究_第2页
基于特征抽取和转换方法的全文检索研究_第3页
基于特征抽取和转换方法的全文检索研究_第4页
基于特征抽取和转换方法的全文检索研究_第5页
资源描述:

《基于特征抽取和转换方法的全文检索研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论炙MASTER‘S’rHESlS硕士学位论文基于特征抽取和转换方法的全文检索研究论文作者:贺凡黎指导教师:张茂元教授学科专业:计算机应用技术研究方向:自然语言处理华中师范大学计算机学院2014年5月⑧硕士学位论文MASTER’STHESISFullTextRetrievalResearchBasedOntheFeatureExtractionAndConversionMethodATheSisSubmittedinPartialFulfillmentoftheRequirementsFor

2、theM.S.Degree讯ComputerapplicationtechnologyByHeFanliPostgraduateProgramSchoolofComputerCentralChinaNormalUniversitySupervisor:ZhangMaoyuanAcademicTitle:ProfessorAcademlc11tierotessOrSignatureApprovedMay.2014⑨硕士学位论文MASTER’STHESIS华中师范大学学位论文原创性声明和使用授权说明原创

3、性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。作者签名:准R囊日期:20f牛年今月堙日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中师范大学可以将本学位论

4、文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。作者签名:境fL蘩日期:)0f忤S月岛日撕弛加札日期:乃f¥年S月28日本人已经认真阅读“CALIS高校学位论文全文数据库发布章程”,同意将本人的学位论文提交“CALLS高校学位论文全文数据库”中全文发布,并可按“章程”中的规定享受相关权益。圃童途塞握童后进卮!旦主生;旦二生;旦三生筮鱼!作者签

5、名:礓允霖日期:Ⅻ彤年S月蚜日导师始飙日期:2科够年S月28日⑧硕士学位论丈MASrIER’STHESlS摘要在信息检索技术随着互联网的迅猛发展而日趋成熟的同时,搜索引擎也已经成为人们日常生活中越来越不可缺少的重要工具和手段。传统的信息检索是在基于关键词匹配的基础上,机械地匹配仅仅包含有指定关键词的文档来获得相关文档,这种方式常常会带来语义理解上的错误,越来越不能满足现状用户的需求和科学研究的需要,于是语义分析和挖掘显现了在检索中的重要性。由于汉语语言的二义性和相关性,在一定程度上造成了不确定性和模

6、糊性,潜在语义分析的方法被广泛用于信息检索领域,它的核心是针对词语和文档进行分析,建立一个矩阵,并作加权转换,用于计算的加权函数又直接影响潜在语义分析的结果。这样建立起的词与词之间的语义关系矩阵,在很大程度上消除了由于词语语义的多样性和随意性导致的对检索结果产生的偏差。然而这种方法依然忽略了语言的模糊性和不确定性,所以将云模型理论引入到信息检索研究中,挖掘出一些潜在的语义信息。LDA模型,被用于挖掘潜在的主题结构,这些主题上分布的词是在语义上相关的。但是主题在语义上具有不确定性。本文在LDA模型的基

7、础上引进云模型理论,利用云模型均值和方差的关系,在抽样时标注了某个主题,就为主题添加主题关系调节因子,建立一个新的特征选择系统。于是新的方法能够抽取出文本的特征集,特征集对于文本具有高的贡献度。新获得的特征集有更少但能最大程度上表示文本的词语。特征词语有不同表示形式的语义信息,两种语义空间下的信息不能直接融合。本文提出了一种特征转换机制,在云空问上对两种语义信息进行转换使其具有一致性,再在一致空间上进行融合,并对标签主题模型进行抽样选择,实现两种语义信息的融合,然后进行查询扩展,运用到检索中,提高检

8、索效果。关键词:信息检索,主题模型,云模型,特征项,概念标签,相关度⑨硕士学位论文MASTER‘STHESISAbstractInformationretrievaltechnologydevelopsmoreperfectwimtherapiddevelopmentoftheIntemet,atthesametime;thesearchenginehasbecomeanimportantandindispensabletoolduringpeople’Sdailyl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。