欢迎来到天天文库
浏览记录
ID:21353292
大小:54.00 KB
页数:6页
时间:2018-10-21
《网络环境下的信息资源检索策略及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、网络环境下的信息资源检索策略及其应用[]:因特X上的信息资源,是指以数字形式记录,以多媒体形式表达,存贮在X络计算机磁介质、光介质及各类通信介质上的信息集合。对X络信息资源及其检索进行必要的研究,有助于人们快速准确地获取X上有用信息,推动社会信息化与信息社会化的双向发展。因此本文阐述了X络环境下的信息资源检索策略及其应用。[关键词]:X络环境,信息检索,信息过滤,文本挖掘一、引言21世纪是一个高度信息化的社会,信息就是生产力,在各个行业信息化发展的同时,人们对信息检索的完备、准确、快捷会有更严格的要求和期望。作为文献信息中心的图书馆也迎来了一个全新的信息环境,丰富的X络信息资源为图书馆的信
2、息服务提供了广泛的资源基础,使X络环境下的信息资源检索策略发生了重大的变化。二、X络信息的特点(一)数量巨大而庞杂。Inter是一个基于TCP/IP协议连接世界各国数以百万计算机X络的通讯X,是一个集各种信息资源为一体的信息资源X。政府、机构、企业、个人等都可以在X上发布信息,因此它己成为无所不包的庞杂信息源,并具有跨地区、分布广、多语种、高度资源共享的特点。(二)内容范围广泛。X上的信息源几乎涵盖了人类知识的全部领域,既有人文科学、社会科学、自然科学、工程技术信息,也有大量生活服务、娱乐消遣等方面的信息。(三)信息类型丰富。其主要形式有X络出版,包括电子、X上图书、电子工具书等;各种动态
3、信息主要包括新闻、广告、股市行情、天气、交通、会议等;还有大量的书目数据库、联机数据库、软件资源以及个人主页、电子邮件等。这些信息都是数字式、多媒体,既有文本的信息,也有大量的图形、图像、音频、视频信息。(四)动态性强。X上信息具有高度动态性,各种信息处在不断生产、更新淘汰的状态,同时连接在一起的各X络、X站、X页都时时刻刻在变化。X络信息还具有交互式特点,如BBS、聊天、游戏等。(五)信息组织特殊、控制性差。因特X上信息的组织以超文本技术链接,构成立体X状文献链,把不同国家地区、不同服务器、各种X页、各类不同文献的相关信息都通过节点链接起来,使得检索相关文献、相关信息非常方便,加强了信息
4、间的关联度,形成了一个X状结构。(六)有序与无序,集中与分散并存。互联X上的信息没有统一控制,虽然从局部来说某个X站、某个数据库是有控制的、相对集中的、有序和规范的,但总的来说互联X的信息没有统一的控制,信息质量良荞不齐,信息也处于分散、无序、不规范的状态之中。三、X络环境下的信息资源检索策略及其应用科学技术的日新月异和用户需求的不断提高促使X络检索工具相应发展,X络环境下的信息资源检索策略及其应用可以分为以下几个方面:(一)信息过滤技术及其应用Inter开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,X络环境也为人们及时准确地检索到所需信息带来了麻烦。信息过滤技术就是在这样的
5、背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。在用户的检索过程中,信息过滤可以通过多种途径实现。第一,关键词的选择。当用户要检索不太熟悉的领域时,系统可以通过提供机读类词表的方法方便用户选词,也可以通过后控词表等方法自动扩大或缩小(通常是通过近义词表扩大)检索范围,提高查全率和查准率;第二,利用过滤模型。过滤模型是目前Inter上信息过滤主要方法,它是通过设计过滤软件并附加到X络信息检索的程序中以增加过滤功能
6、。这主要表现在两个方面,一方面,搜索程序在进行信息搜索时可通过过滤功能过滤掉一些认为价值不大或没有价值的信息;另一方面,用户也可根据自己的需求选择服务项目与内容,通过过滤机制快速找到所需的信息资源。其方法是根据需求设置过滤条件,如不希望获取的、某类主题的内容、某种类型或范围的信息等,程序在运行时一旦触发条件,则可将有关信息删除或拒之门外,而其他信息仍可输入。(二)文本挖掘技术及其运用文本挖掘是知识管理研究领域的新兴分支之一,为文本信息的整理、分析、挖掘提供了有效的手段。传统的信息检索或信息访问,主要根据用户提供的查询条件从文档数据库中检索出相关的文档信息。为了提高信息访问的准确性,检索系统
7、增加了相关处理,如文档分类、自动文摘、主题词自动抽取等方法,使用户能够方便查找到所需信息。在文本挖掘处理中,大多采用神经X络模型描述文本及文档数据库各概念之间,以及概念和文档之间、文档与文档之间的相互关系在信息检索中,无须分析文档中概念之间的相互关系,只要依据用户的查询,返回相关文档集合。但是,文本挖掘不仅能够区分不同的概念,还能够分析不同概念结点之间的相互关联关系。1、文本内容挖掘在检索中的应用。文本内容挖掘是指从文档
此文档下载收益归作者所有