基于词词关联矩阵改进的模糊检索研究

基于词词关联矩阵改进的模糊检索研究

ID:34668758

大小:8.94 MB

页数:66页

时间:2019-03-08

基于词词关联矩阵改进的模糊检索研究_第1页
基于词词关联矩阵改进的模糊检索研究_第2页
基于词词关联矩阵改进的模糊检索研究_第3页
基于词词关联矩阵改进的模糊检索研究_第4页
基于词词关联矩阵改进的模糊检索研究_第5页
资源描述:

《基于词词关联矩阵改进的模糊检索研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号——UDC密级——编号——学位申请人姓名:生当簦申请学位学生类别:全日舅硕士申请学位学科专业:情报鲎指导教师姓名:要立盘教授萼文火论J巳:

2、⋯山襞位f让么-钎学中士萆硕⑧篙‰s煳煳舢洲咖删煳舢删硼Y2353124硕士学位论文基于词词关联矩阵改进的模糊检索研究论文作者:叶光辉指导教师:夏立新教授学科专业:情报学研究方向:信息组织与检索华中师范大学信息管理学院2013年5月ThereSearCh0ffuzzyretrieValbaSed0nimprovedkeyW0rdDaSed0nlmDr0VedKeVW0rdC0nneCtio

3、nmatrixAThesisSubmittediIlPanialFulfillmentoft11eRequ打ementFortheM.ADeg陀ei砼A如nQgememscienceY,eGuanghuiP0stgraduateProgramSchoolofInformationManagementCentralChinaNormalUniVersi锣SupeⅣisor:XiaLixillAcademicTitle:ProfessorApproVedMay.2013华中师范大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:

4、所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。作者签名:q曳之0日期:Ⅵ几年厂月、诣学位论文版权使用授权书学位论文作者完全了解华中师范大学有关保留、使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属华中师范大学。学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许学位论文被查阅和借阅;学校可以公布学位论文

5、的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。(保密的学位论文在解密后遵守此规定)保密论文注释:本学位论文属于保密,在——年解密后适用本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。一作者挑叫乞之v导师糨磨骱日期:卅、'年r月、佣日期:3,◇\-湃∑月∥J日本人已经认真阅读“cALIS高校学位论文全文数据库发布章程",同意将本人的学位论文提交“CALIS高校学位论文全文数据库”中全文发布,并可按“章程”中的规定享受相关权益。作者签名:川1日期:∥l、,年日⑧硕士学位论文MASTER’ST

6、HESlS摘要基于词词关联矩阵的模糊检索算法通过词词关联矩阵构建算法运行的环境。在算法实践过程中,尤其是用该算法去改进已有的标准布尔检索系统,原有系统效率往往会下降,主要原因集中在两个方面:(1)词词关联矩阵的构造需要大量的数据支撑和长的处理时间(2)词词关联矩阵属于自构造词表,词间关系单一,存在误相关和假相关情形。基于上述问题,本文从词词关联矩阵改进的角度出发,采取多种措施来解决问题。第2部分,通过模糊集合检索模型的规范描述,本节首先定义了检索系统中检索效率和系统效率之间的函数关系,并应用该函数关系对比分析模糊集合检索系统和标准布

7、尔检索系统的性能,指出模糊集合检索系统所面临的“囚徒困境”:检索效率的提升引起了系统效率的下降。之后针对“囚徒困境",从词词关联矩阵方面来改进模糊集合检索策略,寻求到解决“囚徒困境’’的思路和技术手段。最后借助SQL语言演示词词关联矩阵的两种构造策略,建立数学模型分析词词关联矩阵构造的最优时机,并确立该思路为一种新的系统开发模式。根据时机来合理选择词词关联矩阵构造策略有助于改善现有模糊集合检索算法的执行效率,实现检索效率和系统效率的双赢。第3部分,传统上,检索系统利用基于词语共现分析所生成的自构造词表,即词词关联矩阵来实现模糊检索,

8、这种方式生成的词表存在词间关系单一、语词假相关、词义控制差等问题。本节结合传统叙词表,对自构造词表的词间关联度算法进行了改进,新算法丰富了词间关系类型。实证分析表明,新算法有助于提升系统的检索效率。本节首先阐明词间关联度现有算法及关系数据处理方式,并指出现有算法存在的问题,然后引入叙词表控制机制,针对四种词间关系控制情形提出了各自的词间关联度改进算法。最后通过集合从理论上分析改进算法和现有算法,并借助语词关系网实证改进算法对语词关系网的关联性的影响。第4部分,语义网的发展为模糊语词转模糊概念检索提供了可能。鉴于词表在模糊检索系统中的

9、主导地位,实现模糊概念检索必先要完成词表向本体的转换。本节在综合分析和评价已有转换方法的基础之上,提出了综合转换法。综合转换法继承了间转法规范的概念抽取及关联设计规则,又通过综合评议和词信息量、词间关联度、文档频率等参数的算法设计改变

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。