基于传统知识组织资源的本体自动构建

基于传统知识组织资源的本体自动构建

ID:32371364

大小:602.17 KB

页数:10页

时间:2019-02-03

基于传统知识组织资源的本体自动构建_第1页
基于传统知识组织资源的本体自动构建_第2页
基于传统知识组织资源的本体自动构建_第3页
基于传统知识组织资源的本体自动构建_第4页
基于传统知识组织资源的本体自动构建_第5页
资源描述:

《基于传统知识组织资源的本体自动构建》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、情报学报,2009(4)第1页王军等基于传统知识组织资源的本体自动构建∗王军、程煜华北京大学信息管理系,100871摘要本文介绍了基于现有的知识组织工具和书目数据资源自动构建本体的方法:首先根据书目数据揭示的领域知识建立一个用OWL描述的数据模型,然后从词表、类表和书目数据集中自动抽取对象和关系的实例,写入OWL数据模型,形成书目本体。这是构建本体的一条经济、高效、合理且实用的道路。基于该本体,不仅可以实现概念浏览和语义检索,还可以增强搜索引擎的功能,通过词汇服务实现检索词提示和搜索结果归类。基于《中国分类主题

2、词表》和计算机类的书目数据,本文实现了一个语义检索系统KVision,展现了传统知识组织资源对于网络信息资源利用的潜在价值。关键词知识组织、书目数据、本体构建、搜索引擎、语义检索AnAutomaticApproachtoOntologyBuildingbyIntegratingTraditionalKnowledgeOrganizationResourcesWangJun,ChengYu-Hua,WengLiDept.OfInformationManagement,PekingUniversity,Beijin

3、g100871ABSTRACTInthispaper,weintroduceanautomaticapproachforontologybuildingbyintegratingtraditionalknowledgeorganizationresource.Themethodis:tobuildaprimaryontologydescribingtheclassesandrelationshipsinvolvedinbibliographicdatawithOWL,thenfilltheprimaryonto

4、logywithinstancesofclassesandtheirrelationsextractedfromcatalogdatasetandthethesauriandclassificationschemesusedincataloging.Basedonthisontology,wecanimplementconceptualnavigationandsemanticretrieval.Furthermore,itcanbeusedtoenhancethepowerofsearchengineswit

5、hvocabularyservice.WehaveimplementedanonlinesystemtodemonstratetheproposedmethodsandfunctionswiththousandsofbibliographicdataandasubdivisionoftheChineseClassifiedThesaurus.KEYWORDSknowledgeorganization,bibliographicdata,ontologybuilding,searchengine1.引言信息组织(

6、亦称知识组织)是在传统文献信息环境下利用信息的主要手段,这一传统是在图书馆上百年的发展过程中逐渐完善起来的,发展出分类法、词表等成熟的信息组织工具,积累了极为丰富的元数据资源。遗憾的是,这些宝贵的知识资源在今天的网络信息环境下无法发挥出应有的作用。本文提出集成现有的知识组织资源,将之转化为机器可理解的、支持智能处理的本体(Ontology)。并在此基础上,和搜索引擎结合在一起,用于网络资源的组织和利用。本体可看成是知识组织传统在网络信息环境下的延续和发展。它描述了某个特定领域的知识模型∗王军,男(1968),博

7、士,北京大学信息管理系副教授,研究领域:数字图书馆、网络知识组织、文本挖掘、信息检索;Email:junwang@pku.edu.cn。程煜华,男(1983),原北京大学信息管理系硕士,现就职于万方数据公司。1情报学报,2009(4)第2页王军等(由概念和概念间的关系构成),为该领域提供相关的词汇集和推理规则。本体随着语义网的研究和应用得以流行,它是科学知识门户、知识管理、信息集成和融合、电子商务、语义Web服务等应用的关键所在。但是本体的构造十分复杂,它需要领域专家的手工劳动,是展开基于本体应用最大的瓶颈。传

8、统的知识组织资源,包括分类法、词表和书目数据可作为构造本体的基础。本体的构造有两个基本步骤:建模和导入实例数据。其中实例数据的导入可以自动化。建模需要描述某个特定应用领域的概念、概念的属性和其间关系,进而还可以定义相关的约束和推理规则。类表和词表是简洁而实用的知识描述体系;书目数据有国际通用的描述规范(即MARC格式),详细地定义了描述书目文献信息的字段结构和著录方法。可以依据它们为本

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。