计算机网络毕业论文设计.doc

计算机网络毕业论文设计.doc

ID:57444969

大小:2.24 MB

页数:12页

时间:2020-08-19

计算机网络毕业论文设计.doc_第1页
计算机网络毕业论文设计.doc_第2页
计算机网络毕业论文设计.doc_第3页
计算机网络毕业论文设计.doc_第4页
计算机网络毕业论文设计.doc_第5页
资源描述:

《计算机网络毕业论文设计.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、中国教育科技网络用户信息查询状况统计报告(2001/12)徐鸿(美国匹兹堡大学信息科学学院hxumail.sis.pitt.edu)单松巍(大学计算机科学技术系)晓明(大学计算机科学技术系)1993年,美国UIUC大学的超级计算机应用程序国家中心开发出了Internet上最早的Web浏览器Mosaic。网景(Netscape)公司在1994年推出了NetscapeNavigator,微软公司则在1995年推出了InternetExplorer,它们促进了Web爆炸式的增长。美国互联网委员会在2000年9月发布的一份名为《2000年

2、互联网状态》的研究报告中指出,到2000年9月为止,互联网上的网页数量已经达到20亿,预计到2001年达到40亿。用户在如此多的网络数据中寻找所需要的信息,无异于大海捞针,这就是信息过载(InformationOverloading)问题。面对如此大量的信息,人们迫切需要有效的信息发现工具来为他们在WWW上进行导航,网络信息检索系统产生并迅速发展起来,1994年后出现了以Yahoo为代表的网络信息目录和Lycos、Excite、AltaVista、Infoseek、Hotbot等搜索引擎。随着搜索引擎技术的不断发展,它已经成为人们

3、获取网络信息的常用工具,大约85%的用户使用搜索引擎去定位他们需要的信息。搜索引擎和电子并列成为Internet上应用最广泛的服务,几个著名的搜索引擎一直都稳定的处于全球访问量最大的10个之列。迄今为止,网络信息检索问题还有很多问题需要解决,即使是目前世界最大的搜索引擎Google,也只收集了20亿左右网页(至2002年1月1日),并且网页收集速度远远落后于Web上网页的增长速度。由大学计算机系网络与分布式系统研究室研制开发的“天网”中英文搜索引擎系统是国家“九五”重点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果,并于

4、1997年10月29日正式在CERNET上向广大Internet用户提供web信息导航服务(e.pku.edu.cn),受到学术界广泛好评,《软件世界》(1998年7月)将天网评为国最值得关注的搜索引擎。在教育网部,“天网”赢得了广泛的用户群体,为广大学生和老师提供了方便快捷的网络信息检索服务。在“天网”系统对外提供服务期间,广泛采纳用户的意见和建议,不断地改进其服务质量,跟踪世界搜索引擎技术的发展,使系统始终处于国际先进水平。2000年初新成立的“天网”搜索引擎课题组在国家973重点基础研究发展规划项目基金资助下,秉承老的开发队

5、伍的优良传统,致力于探索和研究中英文搜索引擎系统的关键技术,以便向广大用户提供更为快速、准确、全面、时新的海量Web信息导航服务。“天网”二期根据WWW海量数据的特性,设计开发了高效的分布式并行搜集系统和查询系统。该系统采用多台运行Linux和Solaris操作系统的微机为工作平台,以URL作为任务的原子单位,采用基于散列的任务分发策略,结合每台计算机上的并行搜集策略,保证了网页的高速搜集。目前,分布式并行搜集系统的模型系统由15台PC服务器构成,操作系统是Solaris8。每台计算机上启动60个网页搜集机器人,实验结果表明,在网

6、络环境稳定的情况下,平均每天可以获取200万个网页。查询系统由15台安装LINUX系统的PC机组成,索引了全国3000万网页,系统的实际运行和测试表明它有很好的查询响应时间和并发性能,可以提供每天百万次的查询。“天网”二期采用了我们设计的近似镜像网页检测算法,目前已被成功地应用于删除天网系统中的重复网页,能去除98%的重复网页,一方面节省了存储空间,另一方面提高了检索质量。随着WWW上数据量的不断扩大,信息容的不断丰富,人们对搜索引擎的要求也不断提高,这也促进了搜索引擎的进一步发展。新一代的“天网”突破了集中式系统的瓶颈,成为一个

7、高性能的Internet信息发现平台。课题组成员在实验室主任晓明教授领导下,正继续努力跟踪世界先进水平,不断研究新的问题和方向,将“天网”推向一个新的高度,保持我们在Internet信息检索领域研究的领先地位。为了解中国教育科技网络用户信息查询的基本状况,加强搜索引擎的信息资源建设,改进搜索引擎的服务方式,提高系统的检索性能,天网课题组协同美国匹兹堡大学信息科学学院的徐鸿博士完成了本次用户信息查询调查,希望借此帮助用户更为方便有效地获取所需信息。此次调查问卷的容包括用户上网的基本情况、天网查询及用户的个人信息。共收回问卷3107份

8、,其中有效问卷2334份。调查日期为2001年9月11日到11月20日。统计结果如下。1用户个人上网的基本情况1.1使用互联网的时间(N=2334)不到6个月6个月到一年1到3年4到6年7年到7年以上116103137766276由上述图表可看出,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。