创新信息使用技术结课论文

创新信息使用技术结课论文

ID:21671475

大小:64.44 KB

页数:10页

时间:2018-10-23

创新信息使用技术结课论文_第1页
创新信息使用技术结课论文_第2页
创新信息使用技术结课论文_第3页
创新信息使用技术结课论文_第4页
创新信息使用技术结课论文_第5页
资源描述:

《创新信息使用技术结课论文》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、DLMU创新信息使用技术结课论文通信工程王佳静2220142795《创新信息使用技术》结课考核论文模板须知:本模板用于2015-2016学年第一学期选修《创新信息使用技术》课程的全体学生结课考核,共四个题目,内容涉及了创新信息获取、管理、分析、分享利用四大方面,学生根据自身实际情况任选做一道,每道题要求附图和引用参考文献,总字数不少于2000字。在简要介绍搜索工作原理基础上,结合自己使用搜索引擎(常规搜索、高级搜索、命令搜索)解决学习、生活或创新项目中所遇问题的实例,详细比较目前四大主流搜索引擎(百度、谷歌、360、必应)优缺点,并根据自己的搜索经验,针对目前搜索引擎的不足,提出将来希望改

2、进的方向。[格式要求:宋体小四、1.5倍行间,图文并茂,不少于2000字,附思维导图论文内容框架,按GB7714格式附参考文献]自1990年出现了世界上第一个真正意义的网页后,网页数目的增长呈指数形式,每过不到9个月的时间网页总数就会翻一番¨。网络的快速发展给人们的生活学习和工作带来了很多信息,同时也带来了问题,这就是用户如何在信息的海洋中找到需要的资料。这时,搜索引擎的需求就出现了,这使搜索引擎成为人们查询Web信息不可缺少的工具。一、搜索引擎工作原理搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询

3、关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户[1]。互联网搜索引擎通常由54-主要环节构成,分别为网页信息的抓取、网页内容分析、网页索引建立、网页检索结果排序、网页检索工具与接口,主要功能模块结合其他中文信息处理和信息检索技术,完成整个网页的搜索引擎。1.网页信息抓取构建搜索引擎首先要从网上获取网页数据,这种信息抓取功能由网络爬虫(蜘蛛)(spider)来完成。每个独立的搜索引擎都有自己的网页抓取程序爬虫。爬虫Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页

4、快照。2.网页内容分析要实现搜索引擎,网络蜘蛛得到的网页内容只是最基本的前提,这些网页内容必须要进行分析才能用于建立索引。网页内容分析由两层面的任务,分析网页内部的基本信息和对网页内容的结构进行识别。最终的目的都是提取有效数据,过滤垃圾信息。在分析的同时还要进行网页排重,避免相同的结果同时出现。3.网页索引建立经过分析的网页内容需依靠文本索引技术,才能实现信息的有效检索和查找。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要及其他信息。[2] 二、四大主流搜索引擎简介1.百度是目前全球最优秀的中文信息

5、检索与传递技术供应商之一。百度搜索引擎由4部分组成:蜘蛛程序、监控程序、索引数据库、检索程序。搜索引擎使用了高性能的“网络蜘蛛”程序自动地在互联网中搜索信息,搜索范围涵盖了中国大陆、香港、台湾、澳门、新加坡等华语地区以及北美、欧洲的部分站点。百度搜索引擎拥有目前世界上最大的中文信息库[3]。2.Google被公认为全球最大的搜索引擎,也是互联网上5大最受欢迎的网站之一,。1998年9月,美国斯坦福大学的两名研究生拉里·佩吉和谢尔盖·布林开始测试他们设计的Google搜索引擎。目前,每天都有7000万用户登录Google网上搜索引擎,这一网站已在全球范围内拥有无数的用户。用户不仅能够通过Go

6、ogle访问2400万个中文页面,还可以访问其全部目录中超过10亿的Web文件[4]。3.2015年360搜索推出独立品牌好搜。好搜(原360搜索)号称是最干净、安全、可信任的搜索引擎。包含网页、新闻、问答、视频、图片、音乐、地图、良医、雷电、百科、购物等多项搜索产品。好搜搜索属于全文搜索引擎,这是目前广泛应用的主流搜索引擎,例如谷歌、搜狗等。2012年8月16日,奇虎360低调推出综合搜索,360拥有强大的用户群和流量入口资源,这对其他搜索引擎将极具竞争力,引擎索引的优质网页数量超过数百亿,网页搜索速度和质量都已领先业界。360是免费安全的首倡者,认为互联网安全像搜索、电子邮箱、即时通讯

7、一样,是互联网的基础服务,应该免费[5]。4.必应作为最贴近中国用户的全球搜索引擎,是微软公司于2009年5月28日推出的全新搜索引擎服务。中国存在着大量具有英文搜索需求的互联网用户。但中国以前几乎没有搜索引擎,可为广大用户带来更好的国际互联网搜索结果体验。凭借先进的搜索技术,以及多年服务于英语用户的丰富经验,必应致力于更好地满足中国用户对全球搜索——特别是英文搜索的刚性需求,实现稳定、愉悦、安全的用户体验,为中国用户提

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。