UNIMARC到RDF项目命名空间和关联数据

UNIMARC到RDF项目命名空间和关联数据

ID:37325727

大小:466.52 KB

页数:14页

时间:2019-05-21

UNIMARC到RDF项目命名空间和关联数据_第1页
UNIMARC到RDF项目命名空间和关联数据_第2页
UNIMARC到RDF项目命名空间和关联数据_第3页
UNIMARC到RDF项目命名空间和关联数据_第4页
UNIMARC到RDF项目命名空间和关联数据_第5页
资源描述:

《UNIMARC到RDF项目命名空间和关联数据》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Submittedon:July1,2013UNIMARC到RDF项目:命名空间和关联数据MirnaWiller信息科学学院,扎达尔大学,扎达尔,克罗地亚E-mail地址:m.willer@unizd.hrGordonDunsire独立咨询师,爱丁堡,苏格兰E-mail地址:gordon@gordondunsire.comPredragPerožić信息科学学院,扎达尔大学,扎达尔,克罗地亚E-mail地址:pperozic@gmail.com版权属于MirnaWiller,GordonDunsire

2、,PredragPerožić。本著作在创作公用署名3.0许可的条款下可以使用:http://creativecommons.org/licenses/by/3.0/。中文翻译:刘华梅(中国国家图书馆中文采编部)ChinesetraslationbyLIUHuamei(NationalLibraryofChina)文摘:本文描述了用资源描述框架(RDF)表示UNIMARC的项目工作,这是语义网和关联数据的基础。当前的重点是基于UNIMARC书目格式,为字段标识符、子字段以及值词汇的编码信息块开发一套元

3、素集。本文讨论了项目确定的改进UNIMARC标准的问题,特别是使其符合ISBD以及像RDA(资源描述和检索)这样的书目标准。本文还给出了来源于UNIMARC记录的关联开放数据的实例。关键词:UNIMARC,资源描述框架(RDF),ISBD,映射,互操作1简介和背景在波多黎各圣胡安举行的世界图书馆和信息大会:第77届国际图联大会上提交的,随后在IFLA杂志上发表了更新版本的一篇论文(Dunsire&Willer,2011),讨论了用资源描述框架(RDF)1表示UNIMARC书目(UNIMARC/B)和U

4、NIMARC规范(UNIMARC/A)编码格式的一个基本框架,这是语义网和关联数据的语法基础。文章确定了具体问题,并就解决这些问题和开发命名空间来容纳UNIMARC元素集和值词汇提出了一些建议,这些值词汇遵循为其他IFLA书目标准建立的模式,包括功能需求(FR)系列模型和国际标准书目著录(ISBD)。UNIMARC永久委员会(PUC),负责UNIMARC格式的维护,在2012年已经同意继续开发这样的命名空间。虽然向IFLA专业委员会提出的一个申请没有被通过,但PUC能够找到并分配足够的资金支持2013

5、年发起的一个项目(PUC,2012)。该项目的首要点是开发UNIMARC书目格式的命名空间。然而,很明显,将命名空间和其他相关标准分离,只孤立地分析其格式,将会产生一个片面的结果,因为项目并不提供格式功能的信息前景。不过,关系到IFLA和其他相关标准的格式配置,会额外地将格式本身的差异和发展潜力反馈给开发者。本文考虑了UNIMARC书目格式到ISBD的关系,考虑了ISBD统一版中记载的对应性的影响,UNIMARC书目格式和UNIMARC规范格式的关系,以及更广泛的层面,他们和资源描述和检索(RDA)的

6、匹配。在这篇文章中,语词“元素集”和“值词汇”遵循W3C图书馆关联数据孵化小组推荐的用法(Isaacandothers,2011)。2命名空间创建的基本方法UNIMARC格式的文档只适用于机器可读形式,如MicrosoftWord或AdobeRDF文件。这些缺乏自动解析元素集和值词汇所需数据的必要结构,像标签、定义和范围注释。然而,为了人类识别这样的数据,在布局上必须要有足够的结构。从文件中抽取数据的基本方法是人力介入的复制、粘贴,及随后的编辑。能获取的最精细的粒度,在元素集情况下是UNIMARC子字

7、段代码层,在值词汇情况下是符号代码和相应语词。子字段是元素中最小的代码单元。子字段通常是和字段或字段标识符聚合在一起的,遵循ISO2709标准的三位数编码(ISO,2008)。不过,一个字段标识符使用一个或两个指示符能更改子字段和字段标识符本身的语义。一个UNIMARC子字段的完整语义需要包括它的字段标识符和两个指示符。本项目使用的方法假设这是默认情况,因此需为每个允许组合1的字段标识符、指示符和子字段创建一个元素。例如,UNIMARC书目格式200字段标识符(题名与责任说明项)有一个子字段,编码为“

8、$a”,用于正题名。虽然第二个指示符没有使用,第一个指示符可以取两个值中的一个,以区分题名有检索意义或无检索意义的情况。题名的检索意义,也就是正题名,可以通过创建两个元素获取,一个题名是有检索意义的,另一个是无检索意义的。如果一个字段标识符中使用了两个指示符,则为每个子字段创建的元素数是每个指示符取值数的乘积;如果第一个指示符可以取3个值,第二个指示符可以取2个值,则可创建6个元素。这样就确保每种不同的含义都能容纳。为了减少手工从UNIMARC文档中抽取

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。