基于语义扩展的中文信息检索系统设计与实现.pdf

基于语义扩展的中文信息检索系统设计与实现.pdf

ID:34536321

大小:1.21 MB

页数:80页

时间:2019-03-07

基于语义扩展的中文信息检索系统设计与实现.pdf_第1页
基于语义扩展的中文信息检索系统设计与实现.pdf_第2页
基于语义扩展的中文信息检索系统设计与实现.pdf_第3页
基于语义扩展的中文信息检索系统设计与实现.pdf_第4页
基于语义扩展的中文信息检索系统设计与实现.pdf_第5页
资源描述:

《基于语义扩展的中文信息检索系统设计与实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、论文题目基于语义扩展的中文信息检索系统设计与实现专业学位类别工程硕士学号200992230915作者姓名毛媛媛指导教师陈文宇教授万方数据分类号密级注1UDC学位论文基于语义扩展的中文信息检索系统设计与实现(题名和副题名)毛媛媛(作者姓名)指导教师陈文宇教授电子科技大学成都马文龙副教授衢州职业技术学院衢州(姓名、职称、单位名称)申请学位级别硕士专业学位类别工程硕士工程领域名称软件工程提交论文日期2013.3.25论文答辩日期2013.4.29学位授予单位和日期电子科技大学2013年6月23日答辩委员会主席评阅人注1:注明《国际十进分类法

2、UDC》的类号。万方数据BASEDONTHESEMANTICEXTENSIONINCHINESEINFORMATIONRETRIEVALSYSTEMDESIGNANDIMPLEMENTATIONAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:SoftwareEngineeringAuthor:MaoyuanyuanAdvisor:ChenwenyuSchool:SchoolofInformationandSoftwareEng

3、ineering万方数据独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。作者签名:日期:年月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学

4、可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:导师签名:日期:年月日万方数据摘要摘要在信息技术和因特网快速发展的同时,网上的文本数量大量增长,在多样及不同层次变化的信息库中获取所需的信息是一项艰巨的任务。现在市场上大多的检索系统中,用户基本上是通过查询关键词来表达的,用户的实际需求与查询关键词之间往往存在很大语义差距,这种情况下,通过对检索条件、信息组织以及检索结果赋予语义,可以弥补原有信息检索技术的缺陷。汉语中存在大量的同义

5、词,虽然其形式不同,但意思是近义的,由于在信息检索系统中关键词技术不能处理查询词和文档的这种现象,以致一些相关文档不能被正确的检索出来,导致系统的检索性能下降。语义查询扩展是解决这种不匹配现象并提高检索性能的一种有效技术手段。全面分析传统检索扩展方法存在的问题,提出了一种基于局部共现分析概念的查询扩展算法。通过概念语义空间扩展原始查询,获取扩展概念集,并进行初次检索;采用支持向量机的方法划分检索结果,依据共现原理分析相应概念集中不同概念间查询词的共现度,按照分析函数值进行排序,得到最终的扩展概念集。在测试集上进行的实验结果表明,该方法

6、极大增强了算法的检索性能。全面分析了基于局部共现查询扩展算法的信息检索系统的结构性能、算法步骤和节点结构。采用相关的技术分析出了依据语义扩展和匹配的信息检索系统的结构,对该信息检索系统进行层次和功能上的有效划分,对该系统的运行流程进行相应的分析,完善了依据共现度的相似度运算模型,并提出了依据共现度的语义相似度匹配算法。并且详细分析了依据节点语义的相似度Forward-Opposite路由算法以及节点的数据结构。采用计算机编程语言和特定条件,对本文设计的系统进行测试,结果表明本文提出的算法设计的信息检索系统运行状态较为稳定,达到了既定的

7、功能,比传统检索系统具有更好的检索效果。关键词:信息检索;语义查询扩展;局部共现分析;文本分类;系统设计论文类型:应用基础I万方数据ABSTRACTABSTRACTWiththerapiddevelopmentoftheinformationtechnologyandInternet,thenumberofdocumentisgrowinginexponential.Itisbecomingachallengingtasktoobtainneededinformationfrommassive,dynamicanddiversekno

8、wledgedatabase.Inmanyinformationretrievalsystems,theuser’sneedsareexpressedbyquerywordsatpresent.Theactualneed

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。