欢迎来到天天文库
浏览记录
ID:34667037
大小:6.42 MB
页数:90页
时间:2019-03-08
《基于web个性化搜索引擎的研究与设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、江苏大学硕士学位论文摘要随着网络信息量成爆炸式地增长,人们要在信息海洋中找寻自己需要的信息是十分困难的。因此,随之出现的信息检索系统一~搜索引擎成为人们搜索信息的主要工具。虽然搜索引擎为用户的查询信息带来很多方便,但是目前大多数的搜索引擎仍然存在许多缺陷,它们没有考虑到用户的个性和兴趣,只能简单地执行用户的查询需求,只要用户使用的关键词相同,所得到的搜索结果就相同,大大降低了搜索的准确性。所以,如何将搜集的信息资源合理组织,如何从大量的信息中,针对用户不同的兴趣需求,返回用户真正需要的信息,从而实现个性化搜索,成为目前研究的重要课题。本文针对现有搜索引擎系
2、统存在的问题,深入研究实现个性化搜索引擎系统的相关技术,设计并实现了个性化搜索引擎,并且主要专注于个性化搜索引擎的网页资源的分析组织、网页的自动分类以及个性化模型构建更新等方面来分析研究。论文的主要工作如下:(1)对目前的搜索引擎系统进行论述分析。论述分析了目前搜索引擎系统的发展历史、系统架构,并且分析了当前搜索系统存在的一些缺陷,比如查询的准确性不高,不能体现用户的个性。(2)对个性化搜索引擎中的网页特征描述进行了研究,并且提出了一种利用非线性函数改进特征词权重计算的方法。(3)网页的自动分类。研究了目前比较流行的分类算法,利用分类算法对收集到网页信息资
3、源进行分类,从一定程度上缩小了用户的查询范围,提高了查询的效率。(4)个性化模型的构建。采用web挖掘技术对存放在web缓存中的历史页面进行挖掘,获取用户的兴趣信息,利用聚类算法对用户兴趣分类管理,并且利用最优二叉树的形式来表示用户兴趣。利用获取的用户兴趣信息来构建个性化模型。。江苏大学硕士学位论文(5)Agent动态跟踪和个性化模型的更新。利用Agent动态跟踪用户的浏览行为,捕捉用户兴趣的变化,并通过“衰弱因子”、设置权重阈值、兴趣度阈值以及时间阈值及时更新用户兴趣,不断更新模型。(6)利用个性化模型过滤搜索结果,返回给用户的是满足其兴趣需求的个性化结
4、果。这里提出了一种搜索结果过滤算法。关键词:搜索引擎,非线性函数,‘网页分类,个性化模型,最优二叉树Ⅱ江苏大学硕士学位论文ABSTRACTWlththeexplOslVemcreaSeOfn1]fO肋atlOniIlweb,itismfficmtt0searChtheneedediIlfo衄ationininfo咖ationmarine.Somesearchen酉nehasbeC0methemaintoolfor枷}0衄ationsearctl.~thou曲thesearchengiIleb血gsagreatC0nveIlienCeforsearchiIl
5、gmf0皿ation,merearestillmanyshonComingsinmostofsearcheng面es.TheydonotconsiderindiViduali够觚dinterestt0meconsumer,theinqui巧beingablet0oIllycar巧outConsumersimpleneeds.Aslong舔thekeywordmatthecoIls啪erusesisidentical,whatrec0皿aissanceresultidenticalh勰reducedthe辩archtheprecision.There
6、.or
7、c,howtheiⅢb衄ationresourCescollectiIlgisO唱柚izedrationally,inhowseCondarylarge锄。吼t0fiIlfbmlation,dif6erentspecificallyfortheconsumeriIltel.estneeds,retumt0tllehlf0皿ationthatttlecons啪erneedsrcally,real也etheiInponantproblemiIldividuationt0Searchfor,becomiI培tostudyatpresemtllereby.Thep
8、aperailnst0tllepDOblemofseafcheng.mesyStem,h弱gonede印int0也esystematicreleVanCeofsearchengiIletectulologystud咖greal也ationiIldividuation,h弱designedt0carryoutalsoiIldividualsearcheI画nc,锄dmailllybeabSorbediIliIldividualttlea112Ll舛calo唱aIl娩ationsearchedmewebpageresourcesofeng姬e,automati
9、ccl嬲sification锄diIldiVidualmodelo
此文档下载收益归作者所有