欢迎来到天天文库
浏览记录
ID:42206954
大小:771.31 KB
页数:9页
时间:2019-09-10
《如何提高信息检索的精确度》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、目前主流搜索引擎存在的缺陷缺陷一:搜索引擎无法准确的指向用户需求。例如我们现在在百度中搜索“提高搜索准确度”。搜索引擎无法准确的指向用户需求。症结:从搜索的结果来看,√和从搜索者和搜索引擎开发者的两个不同方面来显示结果。这虽然考虑到了信息的全面性,但是无法很好的契合搜索者的需求,导致搜索的精确度和效率下降。解决方法1.信息分类(适用于分类相对比较明显的关键词)将一个关键词的对应方面细分,并且将同一方面归类整合,供搜索者选择。举例:如上面两幅图,如果当我搜索完毕后,搜索引擎如果可以提升:若需要了解更多与提高精准度技术相关资料,
2、请点击Link….2.提高引擎的联想精准度很明显,同样类型的关键字,如果有联想的引导,分类可以更准确地实现。那么这个就需要开发者,更好地进行关键词的抓取。3.改善网页分类系统:如对于关键字搜索结果网页的智能处理,基于摘要的搜索结果聚类等等目前主流搜索引擎存在的缺陷缺陷二:很多时候,在我们的搜索结果中会出现大量重复或极其类似的内容,为用户的筛选带来不便症结:许多搜索引擎会用anchortext(链接源头文字)作为搜索结果的主要依据,anchortext对网页的描述往往更为准确简洁,可是只抓取anchortext而不审查网页内容
3、,会导致大量重复结果被显示。缺陷二解决方法在网页标题和内容中抓取关键字,将重复度较高的内容进行结果折叠,可以让用户在尽量少的页面内获取尽量多的不同信息,同时在用户有需要是也可以很快看到这些重复度高的信息。人人网中“查看类似新鲜事”可以看作是一种不错的解决方案。点开查看另外五条新鲜事,则可以看到你不同好友分享的同一篇日志目前主流搜索引擎存在的缺陷缺陷三:无法根据客户个体需求定制独特的搜索结果从Web1.0发展到Web2.0的时候,我们有个阵痛期。现在,随着互联网大环境的改变,Web2.0已经全面发展到了Web3.0,各种互联网
4、应用又会面临一个阵痛期,搜引擎也不能例外。此时,传统搜索引擎的局限性便暴露出来,虽然满足了用户的通用搜索需求,但并不是为每个人所定制,现实中网络用户的使用习惯千差万别,在搜索结果中反复筛选已不可避免,而这或将是下一代搜索引擎崛起并发展的方向。而且基于pagerank式的算法很容易带来马太效应,被提到越多的网站在结果显示中越靠前,而搜索结果越靠前会导致网站被提到的次数越多,久而久之,一些符合用户真正需求的结果却被淹没。症结:传统的搜索引擎“就事论事”,搜索就是搜索,没有考虑搜索启发的环境,只看到当前的查询串,很少考虑用户的隐含
5、意图;没有(或极少)引入“关系”数据,也就没有“群体智能”,不能利用文档关系(对网页进行分类和聚类)和查询关系。搜索引擎领域或将以此为契机迎来一场技术变革。而用户也迫切需要一种更加智能、更个性、更精确的搜索引擎给他们带来更加精彩的在线生活。以百度为例,用百度搜索某个问题,百科,知道等百度下属网站通常会被它放在很前面,而一些非“亲生”的网站会被放后,使得用户必须翻好几页才能找到有用信息。缺陷三解决方法1.用户介入,个性化定制搜索结果用户可以选择不显示百度百科,或优先显示维基百科等选项,可以对每一条搜索结果“顶”或“踩”,用户的
6、打分会对该站点的显示优先级产生影响。2.基于用户搜索历史优先显示符合用户习惯的结果根据用户以往的搜索历史,了解用户习惯,对结果重新排序。例如,该用户是信息管理专业的一只苦逼,经常为做信息资源管理作业而搜索一些互联网相关内容,那么当我搜索“搜索”的时候,就不要嘲讽我没时间看电影了啊!谢谢大家!
此文档下载收益归作者所有