关于web挖掘的高校图书馆检索系统的分析与应用

ID：32132195

大小：5.35 MB

页数：60页

时间：2019-01-31

资源描述：

《关于web挖掘的高校图书馆检索系统的分析与应用》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、万方数据程硕十学位论文l绪论1绪论1．1研究背景与意义Internet的迅猛发展将人类带入了信息社会和网络经济时代，对人类发展和生活都产生了深刻的影响。随着Internet的广泛应用，人们不再受物理空问的约束，可以随时随地的通过网络进行学习、购物、娱乐等等。面对信息技术如此热潮，抓住这个重大机遇，大力推进教育信息化，以教育信息化带动教育现代化，已成为我国教育事业发展的战略选择。教育信息化以信息技术与教育的深度融合为基础特征，是加强科教结合的重要形式【1】。教育信息化提供信息时代的基本教育环境，促进优质教育资源共享，是实现教育公平与义务教育均衡发展的有力保证。教育信息化推动教育内容、方法

2、、手段、观念的全面改革矛uO,J新，是提高教育教学质量的有效途径怛J。教育信息化是提升教育管理与决策的效率及水平、提高教育公共服务能力的内在要求。为了能够更好做到教育信息化，学校信息中心在全校范围内丌展了信息化工作，帮助各个职能部门和院系实施数字化学习、工作平台、科研平台、档案系统、就业系统等。经过学校数年的努力，信息化工作也有了一定进展，为了使信息化工作更深入进行，学校领导也开始新的一轮信息化推进工作。为了能够响应学校，图书馆在传统的检索系统上开始进行升级，希望借助Internet获取到的数字资源，同时给全校师生提供更人性化的检索及其自适应的检索服务，以帮助全校师生更好地学习，更方便

3、地检索到信息。基于Web挖掘的图书馆检索系统的建设是目前图书馆工作人员以及全校师生所渴望的，一旦建设成功，它的意义是非凡的，主要体现在以下几个方面：1)丰富学校图书馆电子资源一旦Web页面抓取搭建成功，意味着可以从Internet网上获取到海量的数据，这样也就增加了一种电子资源的采购模式，改变了传统采购的单调性。从Internet网上获取到网页数据后，通过程序自动处理获取到学校需要的数据，为了保证数据的合法性、准确性，对于部分敏感数据也需要管理人员对他们进行核对，核对无误之后再进入电子资源库。2)构建服务模式，为工作人员和全校师生提供服务电子资源库的建立，是师生的一个学习资源储备，也是

4、工作人员一个辅助万方数据J：程硕士学位论文1绪论性工作平台。基于Web挖掘的图书馆检索系统的建立，创造了新的服务模式，全校师生可以通过网络不受时fDJ、不受地点、不受期限的访问电子资源，也能够第一时问、更广范围的接触到前沿知识；同时也改变了工作人员传统的调研和采购模式。3)加强信息化工作，推动教育信息化基于Web挖掘的图书馆检索系统的建立，加强了学校信息化工作，推动了教育信息化，提升了整个图书馆的信息化程度。1．2国内外研究的现状分析信息检索是指用户为解决各种学习、工作问题而在Intemet网络上查找、获取相关的电子资源、文献的活动及过程。随着网络信息技术的发展，电子资源的丰富和复杂化

5、，为满足不同用户的检索需求，信息检索正朝着自然语言检索、用户界面人性化、体验效果良好的方向发展，这就需要信息检索技术向更高层次发展pJ。从当前研究来看，信息检索技术主要包括了信息处理技术研究、检索模型的研究、技术应用研究等方面。当今，对于各个高校来说，用户需要检索某些信息时，他们只有通过已有的信息搜索引擎，例如百度、Google、雅虎等来完成信息获取，他们往往给出的也是与用户搜索主题相关的网页或者参考文献【4J。通常情况下，用户在这些信息搜索引擎进行检索时，会将所需要的信息浓缩到一个或者两个关键词中，在浩瀚数据的Intemet上，使用搜索引擎就很难令用户查找到感兴趣或者需要的资料，因此

6、这种基于关键词检索的做法在海量数据的搜索引擎里其命中率就很低了，满足不了用户的需要15J。或许可以折衷考虑，先通过Web页面抓取将影响力大的网页信息下载下来，并组建本地的电子资源库，全校师生可以通过校方的检索系统进行资料查找，这样缩小了搜索范围，同时也就提高了用户查找的命中率。近年来，研究人员已经深入的研究了Web爬虫，人们通过它可以及时有效地检索到所需信息。Web爬虫是搜索引擎的重要组成部分，它是一个为搜索引擎自动下载网页的程序。Web爬虫首先获得初始页面上的URL，然后不断地抽取新的URL放入队列，循环往复，停止时，必须达到系统的一定停止条件【6j。聚焦爬虫是W曲爬虫中的一种，是从

7、主题角度检索信息的信息搜集系统，它可以根据用户设定好的主题，从Intemet网上自动提取与主题相关的网页，主要应用在站点结构分析、主题搜索引擎等方面。与某一特定主题内容相关的网页是万方数据程硕+学位论文1绪论传统的聚焦爬虫抓取的目标，而在网络目录等应用中，大部分歹t是把主题相关网站提供给用户。在网络信息海量增加的今天，单纯依靠人工创造或者维护的网络目录显得越来越不现实，今后的发展前景也不容乐观。网站聚焦爬虫就是在这种形势下产生的，它能够从Int

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 60



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

关于web挖掘的高校图书馆检索系统的分析与应用

关于web挖掘的高校图书馆检索系统的分析与应用

相关文章

相关标签