欢迎来到天天文库
浏览记录
ID:9003904
大小:37.00 KB
页数:8页
时间:2018-04-14
《基于本体的楚辞书目相关检索研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于本体的楚辞书目相关检索研究[摘要]结合楚辞古籍文献的特点,分析楚辞书目实体款目相关性的主要内容及款目间的关联关系,利用本体建模元语定义楚辞书目的类、属性、属性关系和实例,构建楚辞书目本体,实现楚辞书目语义关联检索。通过实例列举直接语义关联检索、间接语义关键检索和语义智能推理检索功能及其实现,并对检索结果的关联程度进行数据统计对比分析。最后提出将楚辞数字目录与相关古籍内容关联的进一步构想。(关键词]楚辞书目 本体 相关性 关联检索 语义1 引言楚辞是战国时期以屈原为代表的楚国人创作的诗歌,2基于本体的楚辞书目相关检索研究[摘要]结合楚辞古籍文献的特点,分析楚辞书目实体款目相关性的主
2、要内容及款目间的关联关系,利用本体建模元语定义楚辞书目的类、属性、属性关系和实例,构建楚辞书目本体,实现楚辞书目语义关联检索。通过实例列举直接语义关联检索、间接语义关键检索和语义智能推理检索功能及其实现,并对检索结果的关联程度进行数据统计对比分析。最后提出将楚辞数字目录与相关古籍内容关联的进一步构想。(关键词]楚辞书目 本体 相关性 关联检索 语义1 引言楚辞是战国时期以屈原为代表的楚国人创作的诗歌,2基于本体的楚辞书目相关检索研究[摘要]结合楚辞古籍文献的特点,分析楚辞书目实体款目相关性的主要内容及款目间的关联关系,利用本体建模元语定义楚辞书目的类、属性、属性关系和实例,构建楚辞书
3、目本体,实现楚辞书目语义关联检索。通过实例列举直接语义关联检索、间接语义关键检索和语义智能推理检索功能及其实现,并对检索结果的关联程度进行数据统计对比分析。最后提出将楚辞数字目录与相关古籍内容关联的进一步构想。(关键词]楚辞书目 本体 相关性 关联检索 语义1 引言楚辞是战国时期以屈原为代表的楚国人创作的诗歌,2000多年以来,楚辞研究者留下了300多种专著、2000多篇论文以及近千种札记,南通大学图书馆和楚辞研究中心采用计算机技术,对收集到的楚辞相关古籍里的文字、图像符号、地图等进行扫描并转化为能被计算机识别的数字符号,进而制成电子索引并通过元数据标引建成楚辞书目数据库和全文数据库
4、,实现关联检索。目前已经完成了近百本楚辞相关古籍的数字化和3000余篇楚辞相关古籍研究论文的全文数字化工作,建成了楚辞书目库、楚辞论文索引库、楚辞音像资料库及楚辞相关古籍全文库等。本文在此基础上利用本体技术对楚辞书目进行语义相关性分析,并构建楚辞书目本体以实现楚辞数字目录语义检索,改进传统检索系统只能查询关键词而缺少概念间语义关联的局限,增强检索结果的相关性和联想性。2 楚辞书目相关性分析传统的书目检索主要依赖于关键词,读者常常因为缺乏对目标词清晰准确的界定,导致检索的准确度和效率不高,同时由于系统极少提供书目关联信息,读者难以沿着感兴趣的文献线索持续检索并发现更多感兴趣的线索。为此
5、,我们在对楚辞相关古籍文献数字化的过程中,首先分析楚辞书目之间的关联性,即选择了楚辞学界公认较权威的姜亮夫先生的《楚辞书目五种》作为底本进行分析。该书从目录学角度将楚辞相关古籍分成5种:楚辞书目提要、楚辞图谱提要、绍骚隅录、楚辞札记目录和楚辞论文目录。分析楚辞书目结构,发现楚辞相关古籍目录结构主要包括古籍作品实体款目、楚辞原著词条实体款目、参见实体款目、责任者实体款目、版本实体款目、载体形态实体款目、人名实体款目、地名实体款目、年代实体款目、音乐实体款目、节庆实体款目、植物实体款目、馆藏实体款目、研究实体款目等,这些款目之间存在着内容和形式上的多种相关性,如表1所示:3 楚辞书目本体
6、构建与书目相关检索实现3.1楚辞书目本体构建过程为了具体实现楚辞古籍实体款目之间的相关性,我们利用本体论思想和本体建模工具构建楚辞书目本体。perez等人按分类法组织和归纳出了本体包含的5个基本的建模元语(modelingprimitive),这些元语分别为类(classes)、关系(relations)、函数(functions)、公理(axioms)和实例(instanees)。楚辞书目本体的构建基于上文对楚辞书目相关性的详尽分析,并参照了frbr概念关系模型、perez的五元组分类法,以《楚辞书目五种》对楚辞相关文献的归纳与划分的书目结构为素材,利用本体建模元语构建的楚辞书目本
7、体共包括35个本体类,24个对象属性,20个数据类型属性,约5300个实例。3.3.1创建楚辞书目本体的类 本体类是一种特殊的资源,它描述了具有共同特征或者在某方面相似的资源的集合。楚辞书目本体的类基于《楚辞书目五种》以及表1对楚辞等古籍实例间的关联分析,划分出了35个基本本体类。部分基本类如表2所示:3.3.2定义楚辞书目本体的对象属性 对象属性是实体间的联系,在资源描述中充当谓语作用。依据《楚辞书目五种》及其涉及的楚辞相关古籍的背景和内容,构建了24个
此文档下载收益归作者所有