搜XX擎使用心得.doc

搜XX擎使用心得.doc

ID:49076253

大小:87.10 KB

页数:11页

时间:2020-02-28

搜XX擎使用心得.doc_第1页
搜XX擎使用心得.doc_第2页
搜XX擎使用心得.doc_第3页
搜XX擎使用心得.doc_第4页
搜XX擎使用心得.doc_第5页
资源描述:

《搜XX擎使用心得.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、搜XX擎使用心得  搜索引擎使用心得xx-xx学年度高一级电脑作业  (1)班级高一27班姓名颜奕钦坐号54利用网络搜索有关知识,回答下列问题。  (注意作业提交时,要以班级号+座号命名,如24班3号,其作业的文件名为2403)1)搜索引擎的发展史互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。  网站分类目录由人工维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。  用户查询时,通过一层层的点击来查找自己想找的网站。  也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。  1990年,加拿大麦吉尔大学(UniversityofMc

2、Gill)计算机学院的师生开发出Archie。  当时,万维网(WorldWideWeb)还没有出现,人们通过FTP来共享交流资源。  Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。  用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。  虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的自动搜集信息资源、建立索引、提供检索服务。  所以,Archie被公认为现代搜索引擎的鼻祖。  2)搜索引擎的工作原理在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数

3、据库的概念。  搜索引擎的自动信息搜集功能分两种。  一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。  另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。  由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自

4、动将你的网站收录。  当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。  3)搜索引擎的分类1.全文索引全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。  它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。  根据搜索结果的不同,全文搜索引擎可分为两类,一类拥有自己的检索程

5、序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。  2.目录索引目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。  用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。  目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!、新浪分类目录搜索。  3.元搜索引擎元搜索引擎(METASearchEngi

6、ne)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。  著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。  在搜索结果排列方面,有的直接按排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。  其他非主流搜索引擎形式  (1)集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在xx年底推出的搜索引擎。  (2)门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服

7、务,但自身既没有分类目录也没有网页数据库,其搜索结果完全其他搜索引擎。  (3)链接列表(FreeForAllLinks,简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多4)常用搜索策略与搜索技巧1.利用AROUND(n)限定关键词距离如图中,在谷歌搜索框内搜索时,在两个关键词之间加入AROUND(n),注意要大写。  n是两词相距的距离范围,单位为单词(搜英文)或字(搜中文)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。