欢迎来到天天文库
浏览记录
ID:37222198
大小:2.88 MB
页数:70页
时间:2019-05-19
《可扩展桌面搜索系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、西南交通大学硕士研究生学位论文第1页曼曼曼璺曼曼皇曼曼曼曼曼曼曼曼曼曼皇寰曼曼鼍曼曼曼曼曼曼曼皇曼曼曼蔓曼曼曼曼曼曼曼曼鼍蔓曼曼曼曼曼曼鼍曼曼曼曼曼皇曼/,——II摘要随着计算机和信息技术的发展,人们可以无节制地从互联网上获取资源并存放到个人电脑硬盘上。这些日益积累而成的大量资源文件,具有格式多样和存放位置不一等特点,从而导致我们很难快速而又准确地找到所需的资料。操作系统内置的文件搜索功能,由于检索速度慢,只能检索到部分文件等问题,很难满足人们对信息检索的需求。桌面搜索技术应运而生,人们可以通过桌面搜
2、索系统快速而又准确地找到所需的资源文件。本论文对用户的日常信息检索活动进行行为分析并得出系统的关键需求,引入主题树的概念帮助用户对信息资源进行重新分类组织。分析了搜索引擎的索引处理和查询处理组件,采用高效的倒排索引和有效的分词组件,运用组件编程和多线程控制等技术对系统进行了设计和实现,并加入可扩展特性和语义检索支持功能。论文从分析人们的日常信息检索活动入手,总结其中存在的问题并以此为基础提出系统的需求;在系统设计阶段,强调系统的整体结构,先从概念上把握系统的处理流程,把系统分为索引处理子系统、查询处理
3、子系统和主题树管理子系统,再分别阐述每个子系统的详细设计思路及其交互关系,并辅助运用类图和顺序图使设计更加明朗化。最后,结合类图和部分关键代码对系统的实现进行阐述。本论文的研究扩展了搜索技术在桌面系统上的运用,有助于提高人们日常信息检索活动的效率和效果,并且为设计和实现具有可扩展特性的信息检索工具提供了一种.思路。.关键词:桌面搜索;可扩展性;主题树;倒排索引;组件编程;多线程处理AbstractWiththedevelopmentofcomputerandinformationtechnology,
4、peopleCanobtainres01JrCes丘DmInt锄etandstoretheminpersonalcomputerswithoutanylimitation·Thoseaccl】m.I】1atingresourcefilesareofvariousformatsanddifferentlocations,thusweCanhardly6ndmercsourc懿weneedfastandprecisely.Inthemeantime,thesearchenginebuiltmop训ngsy
5、stemhaslowretrievalspeedandCallonlyfindsomeofthosefiles,SOtheyCanhardlVsatisfytheusers’needoninformationretrieval.Thatiswhydesktopsearchw嬲broughtout,SOthatUSCl蛋Callfindfilesfastandpreciselybyusingdesktopsearchengme·Thisthesisanalyzesusers’dailyinformati
6、onretrievalactivities,thencomingupwi也也ekevrequirementsofthesystem.Besides,weintroducetheconceptofTopicTreetoassistuserSreclassifyinfcIrmationresources.TheindexprocessingandqueryprocesslngcomponentSofsearchengineareanalyzed,thenweadopthighlyefficientinve
7、rtedfilesi11deXandefficientwordsegmentationcomponent,usingcomponentprogramming孤dMulti.ProcessingtechnologytodeSignandimplementthesystem.MeanwhileextendibilityandsupportingfunctionofSemanticretrievalaleaddedaswell·Thisthesis删edfromUSeI'S’dailyinformation
8、retrievalactivities,andcameupwithrequir锄entsofthesystembasedonconcludingexistingproblems.Whendesigningthesvstem,whatitemphasizesisthesystemconceptionsandwholeframeworks.Firstly,designthesystem,Sprocessflow,anddivideit.intoindexpr
此文档下载收益归作者所有