蒙古文信息检索系统中检索单元选取方法的研究.pdf

蒙古文信息检索系统中检索单元选取方法的研究.pdf

ID:57746177

大小:1.83 MB

页数:60页

时间:2020-03-27

蒙古文信息检索系统中检索单元选取方法的研究.pdf_第1页
蒙古文信息检索系统中检索单元选取方法的研究.pdf_第2页
蒙古文信息检索系统中检索单元选取方法的研究.pdf_第3页
蒙古文信息检索系统中检索单元选取方法的研究.pdf_第4页
蒙古文信息检索系统中检索单元选取方法的研究.pdf_第5页
资源描述:

《蒙古文信息检索系统中检索单元选取方法的研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、整I簪髯分类号UDCTP391.42论文题目研究生:置俊墓指导教师:直光塞熬援.专业:盐篡扭型堂皇堇苤研究方向:蟹篚筐息处堡所在学院:让篡扭堂院2011年5月9日t-rIIlIIllrllr111rilliIr[IliltfIqIIfY1887437一原创性声明本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得的研究成果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得内墓直太堂及其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名

2、:暮俊美指导教师签名:—趁El,期:龇(:出El期:在学期间研究成果使用承诺书‘本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将学位论文的全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。为保护学院和导师的知识产权,作者在学期间取得的研究成果(含计算机软件、程序)属于内蒙古大学计算机学院。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学计算机学院就读期间导师的同意;若用于发表论文,版权单位必须署名为内蒙古大学计算机学院方可投稿

3、或公开发表。、学位论文作者签名:垂玺苤’指导教师签名:!鱼竺坠日期:l啦俳日期:。婵√乒.t内蒙古大学硕士学位论文⋯。蒙古文信息检索系统中检索单元选取方法的研究摘要目前,中文信息检索和英文信息检索都进入成熟阶段,但是由于蒙古语言的独特性,蒙古文信息检索还有很多关键技术问题尚未完全解决,这些问题的解决对蒙古文信息检索的发展具有重要的意义,本文所研究的课题就是其中之一。蒙古语是内蒙古自治区的主体民族语言,是属于黏着性语言。蒙古文单词由词根衔接不同的词缀构成的,本文结合蒙古语的自身特点,利用已选好的信息检索模型对蒙古文信息检索系统中检索单元选取方法做了进一步的研究。供选择的

4、信息检索模型有TF.IDF模型、向量空间模型和语言模型,并采用三种平滑算法进行平滑处理,分别是Good."lutingSmooth方法、JMSmooth方法、KatzSmooth方法,供选择的检索单元有整词形式、词根形式、词根+词缀的形式、r1.gram形式,‘对每一种选取好的检索单元,都进行以下四个步骤:对语料库建立索引,解析Query,检索以及评价,从而比较它们的查全率和查准率,找出合f适的检索单元。本文使用了29510篇文档,文档集大小为156M,我们对此建立了信息检索测试,包括:语料库、12个Topic及对应的相关性文档。运用Lemur搭建了信息检索实验平台。

5、实验结果表明蒙古文信息检索系统中较为适合的检索单元为词根+2个词缀形式和n.gram(n=4)形式。关键字:蒙古文信息检索,检索单元,语言模型,Query结构化StudyontheMethodsintheSelectionofRetrievalUnitInMongolianInformationRetrievalSystemABSTRACTCurrently,theinformationretrievalofChineseandEnglishhasenteredintoamaturestage.However,duetotheuniquenessofMongolian

6、language,therearemanykeytechnicalproblemsyettoberesolved.ThesolutionoftheseproblemshavegreatsignificanceonthedevelopmentoftheMongolianInformationRetrieval.ThesubjectthatstudiedinthispaperiSoneofthekeytechnicalproblems.MongolianisanethniclanguageofthemajornationalityinInnerMongoliaAutono

7、mousRegion,itisanagglutinativelanguage.Mongolianwordsareformedbyattachingaffixestoaroot.InaccordancewiththecharacteristicsofMongolian,thispapermakesafurtherresearchonthemethodsintheselectionofindexunitinMongolianInformationRetrievalwithsomespecificinformationretrievalmodels.Inf

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。