欢迎来到天天文库
浏览记录
ID:35047192
大小:5.44 MB
页数:61页
时间:2019-03-17
《分布式蒙古文搜索引擎系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码1〇巧6号31409039学_分类号编号;_-,靡INNERMONGOLIAUNIVERSITY心.顯±學隹繼褒.滅^1浸¥返肢〇1覆浸担肢TATIOM分布式蒙古文捜索引擎系统龄研究与实现A片与留立已,.中中-?--.嘴v>*<j>r:、?>学焼:计算机学院指导教师:魏宏富<--■(■*t.斗■—、专业:计算机技术_.__一■研究方向:智能信息处理;,.;;—研究生:邢朝尤.
2、.?.fc?—4026学号:31409039学校代码:11分类号:TP391.3编号:论文题目分布式蒙古文搜索引擎系统的研究与实现学晓;计算机学院专业:升算机技术研究方向:智能信息处理姓名:邢朝发指导教师:魏宏專2016年5月31日原创性声明本人声明:所呈交的学位论文是本人在导师的指导下进斤的研巧工作及取得的研究成果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研巧成果,也一不包含巧获得内蒙古大学及其他教育机构的学位
3、或证书而使用过的材料。与我同工作的同志对本研巧所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:J邹/心指导獅齡:f日期::7^/1.,PI《.\勺日期!]j在学期间研究成果使用承诺书本学位论文作者完全了解学校有关保留,:内蒙古大学、使用学位论文的规定即有权将学位论文的全部内容或部分保留并向国家有关机构、部口送交学位论文的复印件和磁盘,允许编入有关数据库进行检索。,也可W采用影印、缩印或其他复制手段保存、汇编学位论文为保护学院和导师的知识产权,作者在学期间
4、取得的研巧成果属于内蒙古大学。作者今后使用涉及在学期间主要研巧内容或研究成果,须征得巧蒙古大学就读期间导师的同意:若用。于发^论文,版权单位必须署名为内蒙古大学方可投稿或公开发表学位论文作者签名:\指导教师签名:M4曰期。;I"、巧日期;内蒙古大学硕女学位论文分布式蒙古文搜索引擎系统的硏究与实现摘要一作为蒙古族地区的官方文字之,蒙古文在人们的生活中起着重要的作用。蒙古文国际标准编码发布之后,蒙古文信息化步伐加快、互联网技术不断发展,数据资源快速积累。如何能够从大量的蒙
5、古文数据中获取有价值的信息。,对蒙古族人民具有重要意义作为信息检一索的重要应用,搜索引擎技术可W满足蒙古族人民这迫切需求。然而,目前对蒙古文搜索引擎技术的研究才刚刚起步,尚无分布式处理方面的相关研究。本文在目前较为成熟的化doop分布式平台下,首先根据蒙古文的构词特点和Lucene分析器的工作原理,开发蒙古文分析器,实现utch蒙古文的词干提取;其次,通过对N增加蒙古文切词插件化及用二tc户界面等相关模块的次开发,实现Nuh对蒙古文的良好支持;最后,开发出运行于化doop分布式平台
6、的蒙古文搜索引擎系统。本文主要关注蒙古文全文检索和搜索引擎技术的基本原理、蒙古文的构词特点和词干词缀提取、Lucene分析器的工作原理、Nutch的化doo。框架结构和插件机制,及p集群搭建的相关过程分布式蒙古文搜索引擎系统的实现,可W帮助人们在大量蒙古文文本资源(如网页等)中快速、准确的找到所需信息。这对提高蒙古I分布式蒙古文拽索引窜系统的研巧与实现文文献的利用率及蒙古文信息化建设具有重要意义。关键補蒙古文;搜索引擎;分布克Nutch;LuceneII内蒙古大学硕±
7、学位论文RESEARCHANDIMPLEMENTATIONOFDISTRIBUTEDMONGOLIANSEARCHENGINESYSTEMABSTRACTAsoneoftheofficiallanuagesinInnerMongoliaAutonomousgM’Region,化eongolianlanguageplaysanimportantroleinpeopleslife.Afterreleasing化einternationa
8、lstandardcodingof出eMongolianlanguagealarernumberoftheMonolianinformationwaseneratedand,gggaccumulatedwiththedevelopingoftheInternettechnology.Hence
此文档下载收益归作者所有