欢迎来到天天文库
浏览记录
ID:9890967
大小:45.00 KB
页数:4页
时间:2018-05-14
《浅谈数字图书馆的网上资源智能化信息服务》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浅谈数字图书馆的网上资源智能化信息服务彭静上海交通大学安泰管理学院上海200052[摘要]本文对如何利用数字图书馆的网络信息资源进行智能化信息服务及在此基础上进行个性化服务做了简要的介绍。[关键词]数字图书馆内容获取知识创造TheIntelligentInformationServiceofWebResourcesinDigitalLibraryPengJingAetnaSchoolofManagement,ShanghaiJiaotongUniversity,Shanghai200052[Abstract]Inthein
2、ternetera,libraryisonthewayfromthetraditiononetodigitallibrary.Avarietyofinformationresourcesontheinternetbecometheimportant“holdings”ofdigitallibrary.Thepapergivesabriefintroductiontohowtoprovidethecustomerswiththeintelligentinformationserviceandthecustomizedserv
3、ice.[Keywords]digitallibrary,contentacquisition,knowledgecreation1引言随着计算机和网络通讯技术的飞速发展,人类社会进入全球信息化的网络时代,作为信息和知识服务提供者的图书馆面临严峻的挑战和改革,逐渐从传统图书馆向数字图书馆(DigitalLibrary,以后简称DL)转变。图书馆的传统含义是一个“场所”(place),它向读者提供服务,帮助读者获取知识和交流知识。而DL则突破了物理场所的限制,将重心转向了“图书馆服务”(libraryservice)——不再
4、是一个具体的事物,如用于存储各种信息载体(即书目文献)的仓库,而是一种服务。她的宗旨是超越时空的限制,从浩如烟海的信息源中将信息准确、快速地提供给所需的读者。在网络通讯技术的支持下,DL强调的是“资源共享”,因此又有人说DL是一个“互联空间”或“赛伯空间”(cyberspace)。DL的馆藏资源不再局限于本馆的文献资源,还包括分布在网络各处的所有共享资源。在网络环境下,对网络中分布式资源进行分析、筛选、提炼出有用的知识,准确、快速地提供给用户成为DL信息服务的重点。DL的信息服务正是结合信息技术、人工智能和数据挖掘技术,深
5、入挖掘网上数据内在的知识,为用户提供精细化、个性化的信息服务,可以说是一种智能化的信息服务。2网上资源智能化信息服务网上资源智能化信息服务包括主要内容获取和知识创造两个方面的工作。内容获取是从网络上收集各种数据,包括结构化数据(数据库中数据)、半结构化数据(html页面或者xml页面)和非结构化信息(文本文件);知识创造是对获取的数据进行标准化,对数据进行结构化处理,同时进行语义集成,最后利用数据挖掘技术提取知识以能够准确地、个性化地展示给不同的用户。2.1内容获取内容获取分为2阶段:网上信息检索和网上信息提取。2.1.1
6、网上信息检索:包括手工采集、自动采集和数据查询。n手工采集:是指图书馆工作人员在浏览过程中,发现所需要的信息后,手工下载保存。该方式检准率高,检全率低。n自动采集:利用爬行技术在网页中自动采集。先指定采集的起始页面,然后根据起始页面中的超链接采集延伸页面的信息。n数据查询(query):输入某一建立了索引的检索键值,系统将搜索命中记录,将检索结果反馈给用户,包括结构化数据查询、搜索引擎和元数据搜索。结构化数据查询是对结构化或者半结构化信息进行检索,检索结果以html形式提供给用户;搜索引擎有2种方式:站点索引(sitein
7、dex,目标文档所有者建立的索引,如www.amazon.com建立的本网站的查书索引)和第三方索引(third-partyindex,引用其他站点所创建的索引,如www.yahoo.com引用的其他站点(如www.amazon.com)的文档信息,搜索会受到其他站点的限制。);元数据的搜索是将查询发送给多个索引(其他搜索引擎所建立的),并将结果综合起来,包括:站点元数据搜索(site-specificmeta-search)、第三方元数据搜索(third-partymeta-search)和混合元数据搜索(mixedme
8、ta-search)。2.1.2网上信息提取:一旦所有可能有用的相关数据集中在一起,就需要对它们进行关键信息的提取,为日后用户的查询奠定基础。由于数据结构的不同,提取的难易程度及提取方法也不一样。n结构化数据:容易提取,因为数据可以拆分成一个个字段,各个信息能够轻易地被识别。n非结构化数据:很难提取,因
此文档下载收益归作者所有