google vs 百度 对搜索引擎习惯的分析

google vs 百度 对搜索引擎习惯的分析

ID:12278544

大小:15.96 KB

页数:5页

时间:2018-07-16

google vs 百度 对搜索引擎习惯的分析_第1页
google vs 百度 对搜索引擎习惯的分析_第2页
google vs 百度 对搜索引擎习惯的分析_第3页
google vs 百度 对搜索引擎习惯的分析_第4页
google vs 百度 对搜索引擎习惯的分析_第5页
资源描述:

《google vs 百度 对搜索引擎习惯的分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、GoogleVS百度对搜索引擎习惯的分析Google更乐于收录大站的页面,百度则乐于收录新站的页面。Google是按照网页级别(PageRank)来收录的,只要网站有一定的网页级别,Google会快速收录的,而没有网页级别的网站,Google则坚决不去收录。Baidu则很夸张,采用的是来者不拒,多多益善的原则。因此,大量的新网民和新手喜欢用百度搜索,因为百度往往搜索到很多别处搜索不到的页面,但内容的匹配度则令人质疑,而专业人士则更喜欢用Google。Google搜索引擎习惯就汉语而言,Google收录有以下特点:1、敏感度较高,反应较快Google对有外部

2、链接或者向Google递交过网站登录信息的新建网站具有较高的查知性。Google收录新建网站的两个途径是:第一,通过网站的外部链接;第二,通过向Google提交网站登录数据。一般而言,后者的收录速度相对较快,而前者则要视Google对新建网站的外部链接网站的收录频率而定。如果Google对外部链接网站的评价高、收录频率高那么其发现新站的速度也相应地高,新建网站被收录的日期就会被提前。2、并重相关性和重要性Google使用PageRank技术检查整个网络链接结构,并确定哪些网页重要性最高。然后进行超文本匹配分析,以确定哪些网页与正在执行的特定搜索相关。在综合

3、考虑整体重要性以及与特定查询的相关性之后,Google才将最相关最可靠的搜索结果放在首位。这也是Google收录网页的特点之一。3、变化较快、机动性较高Google漫游器会定期抓取Web,将大量网页列入索引。稍后完成的下一次抓取会注意到新网站、对现有网站的更改以及失效的链接,并对内容的变化在搜索结果中加以调整。4、较重视链接的文字描述Google会将链接的文字描述作为关键词加以索引,所以我们在作友情链接时千万要仔细设计链接的文字描述,使之既符合网站的定位又不失相关性,以此博得Google的信任。5、较重视网页Meta标记的描述Google使用的技术:Pag

4、eRank技术:PageRank能够对网页的重要性做出客观的评价。PageRank并不计算直接链接的数量,而是将从网页A指向网页B的链接解释为由网页A对网页B所投的一票。这样,PageRank会根据网页B所收到的投票数量来评估该页的重要性。超文本匹配分析:Google的搜索引擎同时也分析网页内容。然而,Google的技术并不采用单纯扫描基于网页的文本(网站发布商可以通过元标记控制这类文本)的方式,而是分析网页的全部内容以及字体、分区及每个文字精确位置等因素。Google同时还会分析相邻网页的内容,以确保返回与用户查询最相关的结果。百度(baidu)搜索引擎

5、收录习惯百度(baidu)是全球最大的中文搜索引擎,对中文网页的搜索技术在某种程度上领先于Google,百度在某些方面与Google有相同或相似之处外它还有以下特点:1、较重视第一次收录印象网站给百度(baidu)的第一印象比较重要,相对Google而言,百度搜索引擎的人为参与度较高,也就是说在某些层面上可能由人来决定是否收录网页而不是由机器来决定。所以,网站在登录百度搜索引擎之前最好把内容做得丰富点、原创内容多一点、网页关键词与内容的相关度高一点,这样才能给百度较好的初次印象。2、对网页的更新较敏感百度(baidu)对网页的更新相对Google而言更加敏

6、感,可能这与百度的本土性格有关。百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间。所以在百度的搜索结果中基本上都标明了收录时间。3、较重视首页百度(baidu)对首页的重视程度要比Google高得多,这与上面提到的“较重视第一次收录印象”一脉相承。百度在显示搜索结果时也常常把网站首页显示出来,而不具体到某个内容页(当其认为不够重要时)。相对而言,其用户体验打了折扣,而增加了其“百度快照”的用户量。4、较重视绝对地址的链接百度(baidu)在收录网页时比较重视绝对地址的收录,百度提供的网页快照功能也没有解析相对地址的绝对路径,不知这是百

7、度技术的疏忽还是其偏好的一大体现。5、较重视收录日期百度(baidu)对网页的收录日期非常看重,也是其搜索结果排名的参考点,被收录得越早排名会较高,有时甚至不考虑相关性地把它认为比较重要的内容放在首位,而点击进入之后才发现是早已过时的信息或者垃圾信息。这是百度需要改进的技术。百度使用的技术百度(baidu)使用以下技术:“一种互联网上镜像和准镜像网站的识别方法”,这个方法解决了搜索引擎对雷同信息的重复获取,节省网络资源和本地资源,提高系统服务的质量和效率;“一种基于词汇的计算机索引和检索方法”,该方法对一段连续的文字信息,经过词汇分析处理后,通过添加隐形词

8、汇的手段,实现对基于词汇索引和检索系统的检索质量提升,使用户获得更

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。