搜索引擎原理.pdf

搜索引擎原理.pdf

ID:52253846

大小:3.40 MB

页数:48页

时间:2020-03-25

搜索引擎原理.pdf_第1页
搜索引擎原理.pdf_第2页
搜索引擎原理.pdf_第3页
搜索引擎原理.pdf_第4页
搜索引擎原理.pdf_第5页
资源描述:

《搜索引擎原理.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第五章WWWWWW经济信息搜索5.1利用搜索引擎检索5.2利用WWW专业经济信息网站检索5.1利用搜索引擎检索5.1.1利用通用搜索引擎检索�搜索引擎类型有:�目录网站式搜索引擎�全文式搜索引擎�元搜索引擎目前目录网站和全文搜索是相互融合渗透的如Yahoo默认采用Google的搜索引擎提供页面搜索;Google采用“OpenDirectory”目录提供分类查询�元搜索引擎Highway61(http://www.highway61.com)Highway61是并行式元搜索引擎,可以同时调用AltaV

2、ista、Excite、Infoseek、Lycos、WebCrawler、Yahoo6个独立引擎,并将它们传回的结果进行排序,显示给用户。Mammahttp://www.mamma.com万纬搜索http://www.widewaysearch.com�搜索引擎原理搜索引擎品种繁多、功能不一,但是总体结构和基本工作原理是相同的。每个搜索引擎都有三个部分组成:(1)采集信息的“机器人”;(2)对采集到的信息进行索引并建立索引库的索引器;(3)完成用户提交查询请求的“检索器”(检索界面)。Server

3、SideClientSide資料來源:http://computer.howstuffworks.com/search-engine1.htm�搜索引擎使用技巧1、使用多个关键词,精确检索結果�关键词愈明确,搜尋結果愈精确电影行动目标希特勒2004年诺贝尔文學獎得主�平均輸入1.5个关键词太少�5W1HWhat、Who、Where、When、why、How�搜索引擎使用技巧2、要“加”不要“减”,結果更相关�要“+”�臥虎藏龍�臥虎藏龍�電視劇�臥虎藏龍�+電視劇�+電影�臥虎藏龍�+電視劇�+電影

4、�-音樂�+clinton+lewinsky�不要“-”输入的关键词一定不可以出现在結果中�臥虎藏龍�-音樂�+clinton–lewinsky�知識管理-site:.com�搜索引擎使用技巧3、词组查询加引号“”�PhraseSearching�“knowledgemanagement”�“行动目标希特勒”�“思考的技术”�高级检索中:包含完整的字句�专有名詞�字詞順序前后一致�搜索引擎使用技巧4、限定查询范围結果更精确�语言:進階搜尋>查詢網頁語言偏好設定�网域:只在.edu.tw.gov.tw

5、.com.CN�日期:过去3月、6月、一年、任何時間�文献类型:只在或去除.ppt.pdf.doc�分类:网页目录、GoogleDirectory使用高级检索完成限制�搜索引擎使用技巧5、指定字段(FieldSearching)如:�title:knowledgemanagement�title:“knowledgemanagement”�title:”knowledgemanagement”–site:.com以Google为例,语法搜索功能有:(1)对搜索的网站进行限制,“site:指令”  注

6、意:site后的冒号为英文字符,而且,冒号后不能有空格。网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀。例如:site:edu.cn数据库(2)查询某一类文件,“filetype:”。搜索:艺术filetype:ppt(3)“Link”搜索指向某个网站或页面的所有链接如:link:http://www.sytu.edu.cn/(4)“Allintitle”和“intitle”如:intitle:金融(5)“stock:”用于查阅股票信息(6)google的“更多”选项学术

7、搜索专门针对www上来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和文章进行搜索。此服务的排序考虑到每篇文章的全文内容、作者影响度、发表文章刊物权威性,以及该文章被其他学术著作引用的次数等要素,对学术研究来说很有价值。百度的文档搜索:5.1.25.1.2利用WWWWWW门户搜索引擎�中国科学院国家科学图书馆——服务项目社会科学网络资源导航http://www.las.ac.cn/�CALIS重点学科网络资源导航门户�经济学方面的专业搜索引擎�经济学方

8、面的专业搜索引擎(1)intute(http://www.intute.ac.uk/)intute是英国七所大学合作构建的网络资源检索服务平台,其前身是英国资源发现网络(UnitedKingdomResourceDiscoveryNetwork,简称RDN),整合了Altis、Artifact、BIOME、EEVL、GEsource、Humbul、PSIgate、SOSIG八个非常有名的学科信息资源门户,分为科学技术、人文艺术、社会科学、健康与生命科学四个服务模块。检

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。