数字图书馆中自动创建知识库探究

数字图书馆中自动创建知识库探究

ID:46718429

大小:87.50 KB

页数:12页

时间:2019-11-27

数字图书馆中自动创建知识库探究_第1页
数字图书馆中自动创建知识库探究_第2页
数字图书馆中自动创建知识库探究_第3页
数字图书馆中自动创建知识库探究_第4页
数字图书馆中自动创建知识库探究_第5页
资源描述:

《数字图书馆中自动创建知识库探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数字图书馆中自动创建知识库探究【摘要】由散落于各种文献中的学者观点构建成的“学者观点”知识库,是教学科研中非常重要的知识来源。文章提出一种自动创建学者观点知识库的技术构想,解决了通过人工创建此类知识库所带来的庞大的人力投入和漫长的时间投入。文章以创建教育技术学学者观点知识库为例展示了自动创建知识库的过程。【关键词】学者观点知识库;知识智能抽取技术;教育技术学;数字图书馆【中图分类号】G40-057【文献标识码】B【论文编号】1009-8097(2009)12-0095-04一数字图书馆中的“学者观点”知识库

2、1学者观点在教学科研及其相关的工作实践中,经常会就某个概念、定义或论题产生理论上的争议,不同的学者可能会提出不同:Fl的观点,把这些观点全面汇总比较分析,才能够对这个概念、定义或论题理解得比较全面、透彻,这对于教学科研工作者来说尤其重要。因此,人们一般首先会在数字图书馆中全面查找关于某个概念或论题的所有观点,并记录每个观点的提出者、提出时间、文献岀处、提岀背景、观点内容、理论背景等。查找这样类似的观点资料,是一项非常繁琐的工作,特别是要找到最完整的资料,因此,有必要建立一个专门的“学者观点”知识库,以供读者

3、检索查阅。2“学者观点”知识库知识库(KnowledgeBase)是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。"学者观点”知识库,就是将符合“学者观点”形式特征的数字资源,通过某种标准化的编辑过程,而产生的知识库。3“学者观点”知识库的资

4、料来源学者观点来源有很多途径,例如专著、期刊杂志论文、报纸、会议论文,以及其他一些文献资料中。图书馆中的资料数量非常庞大,传统图书馆的标引方法,只能够揭示出诸如“标题、作者、主题、关键词、出版信息”等信息项,而不能够精确地查询和定位到某个学者观点。因此,在这种情况下,很难快速精确地直接查找到所需要的学者观点资料。数字图书馆的岀现和发展,使得数字资源逐渐成为图书馆中资源的主导,数字资源使得快速查找定位资源成为了可能。4“学者观点”知识库的创建思路知识库的资料来源,和“学者观点”知识库本身之间的信息形态,存在重

5、大差异。“学者观点”知识库,是结构化的数据,而知识库的资料来源,比如专著,是非结构化的文本信息,要想创建“学者观点”知识库,就必须通过一定的方式从非结构化的文本中提取出这些结构化的数据。从文本中提取学者观点,有两种创建思路:一是以人工标引的方式,从文本中整理出各种学者观点来,然后按照“学者观点”知识库的信息要素填充到知识库中形成结构化的知识库内容;二是以计算机自动标引的方式,通过专门的计算机程序对文本进行分析,把符合“学者观点”形式特征的数字资源,按照学者观点的信息要素标准进行自动提取,并填充到知识库中。因

6、此,需要创建一种计算机技术,能够实现从非结构化的文本数据中进行自动分析并提取出符合目标数据结构标准的结构化数据,我们把这种技术称为“知识智能抽取技术”。“学者观点”知识库的创建过程,可以用下图的模型来抽象表示:图1“学者观点”知识库的创建过程二知识智能抽取技术创建“学者观点”知识库的目标通过知识智能抽取技术,对数字图书馆中的数字资源进行自动分析,达到创建学者观点”知识库的目标,具体来说,是创建一个结构化的、可持续的、可回溯的、去重的、高度关联的“学者观点”知识库。1结构化的知识库“学者观点”知识库是一个结构

7、化的数据资料,具体的结构可以分为:(1)学者观点岀处数据结构:学者信出版信息。学者信息数据结构为学者姓名、学者个人资料(比如性别、单位、职称、学历等);出版信息数据结构为观点发表时间、发表所在文章、发表所在位置(哪一篇文章的哪一个部分的哪一页的哪一段落的哪一行)、引证情况。(2)学者观点内容数据结构:观点命名信息、观点内容信息。观点命名信息就是对该观点的命名;观点内容信息就是对观点的具体文字性的描述。(3)学者观点标引数据结构:以叙词表的知识结构将学者观点统一整合起来,不同观点针对同一个概念或论题就能够被整

8、合在一起。其数据结构按照叙词表的结构来存储。比如,在教育技术学领域中,针对"教育技术”这个概念,有不同的学者观点,针对“教学技术”这个概念,也有不同的学者观点,而“教学技术”是''教育技术”的下位概念,我们通过叙词表中的上下位词关系功能,就可以将上述两类学者观点关联在一起提供给查询者。2可持续的知识库由于采用了计算机自动分析技术,一旦有新的数字资源(往前回溯、往后增加、对现有数字资源错误的修正),完全可以采用知识

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。