欢迎来到天天文库
浏览记录
ID:34808627
大小:2.29 MB
页数:87页
时间:2019-03-11
《基于xml个性化信息检索系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中南大学硕士学位论文摘要本文针对目前Internet上信息获取存在效率不高与“资源迷向”的问题,以及日益增长的个性化需求,提出了一个面向Web的基于XML的个性化信息检索系统模型,研究了其中的关键算法,所研究的内容目前属于信息检索和电子商务的重要研究课题和热点,具有一定的理论和实际应用意义。本文首先研究了国内外搜索引擎系统及主要算法,分析了搜索引擎系统的主要结构和存在的主要问题,并在此基础上探索了基于XML的个性化信息检索系统所涉及的关键技术和算法,主要围绕用户模型的生成和个性化搜索引擎的系统结构以及提高搜索引擎性
2、能的关键技术三个方面进行。主要的工作是:首先通过天网日志文件对用户行为特征进行了统计分析,指出用户查询词及查询过程相对稳定,由此构造基于行为特征的用户模型,并给出相应生成算法;其次,在分析搜索引擎基本结构的基础上,提出了个性化系统实现的基本结构,并分析了其实现的关键技术;第三,在构造个性化搜索引擎原型系统的过程中,结合统计规律,确定了以提高查准率为主要目标的实现思路,改进了信息抓取策略;优化了网页去噪消重算法;提出了以单字构造中文分词词库的新方法;结合用户模型,改进相关分析方法,并拓展了相关分析的应用领域。理论分析
3、和实验结果表明,构造的原型系统是可行和有效的。关键词:个性化,用户模型,信息检索,相关分析中南大学硕士学位论文Atpresent,peoplearcconfrontingwiththeproblemsofinefficientinquiryinacquiringinformationand‘informationbewilderment’inIntemet,andtheirpersonalizedrequirementsaregrowingdaybyday.Todealwiththem,thispaperpropo
4、sesapersonalizedinformationretrievalmodelbasedonXMLforWrebandresearchesthekeyalgorithminthisfield.Thisresearchisanimportantissueininformationretrievalandisofimportanttheorysignificanceandpracticalsignificance.Atfirst,agreatnumberofsearchenginesystemandmainalgo
5、rithmsathomeandabroadaleresearchedinthepaper.Thenthemainstructureandexistedproblemsofsearchenginesystemareanalyzed,basedontheseresearches,theprimaryalgorithmsandtechnologiesofthepersonalizedinformationretrievalsystemareresearched.Inordertoimprovetheperformance
6、ofsearchengine,thethreeaspectsaroundbuildingofUSer’Smodelandthesystemstructureofthepersonalizedsearchenginearestudiedasfollows:(1)AccordingtostatisticallyanalyzingtheUSer’sbehaviorfeaturesfromthelogfileofTianWang(e.pku.edu.cn),thesearchwordandthesearchprocessa
7、repointedouttoberelativelystable,thentheuser’smodelbasedOllbehaviorfeaturesandtherelevantalgorithmsareproposed.(2)Basedonanalyzingthebasicstructureofsearchengine,thebasicstructureofpersonalizedsystemrealizationisproposed,andthekeytechnologiesofpersonalizedsyst
8、emrealizationareanalyzed.(3)Intheprocessofconstructingthepersonalizedengineprototype,combiningthestatisticalroles,theachievingmethodtoincreasetherateofsearchaccuracyisdetermined,th
此文档下载收益归作者所有