欢迎来到天天文库
浏览记录
ID:34850192
大小:1.41 MB
页数:38页
时间:2019-03-12
《基于web的文献信息服务系统的研究与开发》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、查查叁堂堡主堂堡笙茎———第l章文献信息的处理与服务技术1.1文献信息资源的处理技术在文献信息资源自动处理领域一},,主要的研究重点在自动标引、自动分类、机器翻译。(I)自动标引技术:从信息数据的内容rfl,利用算法自动抽取能够反映文献主题的数掘,组成标引字典。常用的标引技术有词频统计、位置加权等。西文信息的标引技术已经十分成熟,而巾文信息的标引处理却遇到最大障碍,即汉语词组的自动分词问题,这是由于汉语语言本身的结构特点造成的,目前汉语自动分词技术有:词典匹配分词法、切分标记分词法、单汉字标引、智能分词法。(2)自动分类技术:根据信息数据的内容,利用分析算法自动为信
2、息资源分配分类号。主要研究分为两类:词表法分类是通过数据信息分析处理,抽取反映信息内容的主题词或关键词,与主题分类词表进行匹配,从而得到文献信息分类号;聚类法分类足直接对不同文献信息数据进行相似性比较,将村11以度商的文献组成一类,同时自动分配同一的分类号码,这种分类的准确程度取决于棚似度粒皮的取值大小。(3)机器翻译:是一种涉及语言+学、数学、自动化、讣算机等学利的一门边缘学科,它是利用计算机,实现将一种语言信息资源自动翻泽成另一种语言的信息资源。1.2信息资源检索服务技术(1)稚尔逻辑检索:将由检索词和靠尔运算符组成检索表达式,反映检索词之问的逻辑关系,再通过一
3、定检索算法(如顺排检索、倒排检索),采用精确匹配方式,进行信息检索服务。-(2)加权检索:根据用户检索需求,确定检索词的重要程度,给每个检索词附加一个权数,并给出检索命中界限阀值(Threshold),用来限制输出结果。加权检索方法有词加权、词频加权、标引加权、法定数(quorum)加权。(3)模糊检索:即截词检索,是指将带有截词算符的词干或不完整词形作为检索词,采用精确匹配、任意截断或有限截断方法,进行信息检索服务。(4)全文检索:是用于全文检索系统的新型检索技术。它不需要对信息资源进查查盔堂堡:!:堂堡鲨兰——行标引,只是在全文中进行字符串匹配检索,它实质上是基
4、于位置的检索。常用的技术有全文数据库倒排文档结构(包括倒排索引)、建立停用词表、优化数据物理存储分和、优化查询算法等。(5)超文本(Web)检索:足用于Web网页中多元信息(文字、图形、图像、声音、动画)的新型检索技术。超文本(Web)检索系统中的文档组织结构足非线性的,以网页作为检索单元,信息单元之问呈现层次关系。1.3信息资源获取服务技术(1)联机检索服务:通过电话拨号通信线路,直接连接进入大型联机检索系统,调用检索界面,输入相应检索策略,执行实时检索操作。如Dialog、STN等。(2)Web信息服务:访问Web版信息检索服务系统,在检索界面中输入相应检索策略
5、,执行实时检索操作。如111、PQDD、SCl、SDOS等。(3)专业化信息服务:专业信息人员接受用户委托,根据用户所提供的信息需求,提供相应的文献信息服务。1.4Internet技术与信息服务Internet提供各种各样的技术和服务,其11IWorldWideweb是Internet的最有活力、应用最广泛、增长潜力最大的主流服务。作为一个术语,“Web信息”包含了月】户所见到的Web页面内容和“不可视”的其他多种信息资源内容;对现代信息服务而言,Web信息是主要的可利用信息来源。所以说]nternet技术为现代信息服务带来了一个崭新的服务空间。1.5数字图书馆1.
6、5.1概念全球社会资源和信息资源的数字化程度将成为本世纪中衡量一个固家现代化发展进程的主要标志之一。作为信息资源的汇集地和社会资源的重要组成部分,图书馆一直是人类与信息资源之问的沟通桥梁。(1)数字图书馆的定义从信息科学角度看,数字图书馆就是一个现代信息服务系统,它以数字化文献信息资源为基础、以先进的信息技术为手段、提供高效的信息服务。数字图书馆的建设主要包括两大方面:1)利用现有的先进信息技术,对传统图书馆的多查壹叁堂堡主兰丝堡壅——种媒体资源,进行数字化处理和存储,构建数字图书馆基础信息资源库,形成虚拟化的共享信息资源;2)依托计算机网络,构建基于Web的现代信
7、息服务体系,建立世界范围内图书馆或信息服务系统之间的虚拟连接,实现全球化信息资源共享模式,为快速、准确地获取信息资源提供便捷的途径、商效的手段和网络化的信息服务。(2)体系结构日l订数字图郫馆的体系结构有两种形式:一足基于Web的三层B/s结构,即山客户端、Web服务器、信息资源数据库及管理系统四部分组成;二是“面向对象、分布式的网络体系结构”,它由用户接口、对象库、调度系统和查询系统等组成。(3)研究领域数字图书馆的主要研究领域足信息数字化处理技术、信息资源库建设和信息服务技术。所以说,现代信息服务的目标足:依托着信息资源库的建设成果,综合利用信息数字化处理技
此文档下载收益归作者所有