DB13T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据

DB13T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据

ID:8258291

大小:401.99 KB

页数:25页

时间:2018-03-14

DB13T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据_第1页
DB13T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据_第2页
DB13T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据_第3页
DB13T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据_第4页
DB13T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据_第5页
资源描述:

《DB13T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ICS01.140.20A14DB13河北省地方标准DB13/T2351.1—2016标准文献结构化数据规范第1部分:全文元数据StructureddataspecificationsofstandarddocumentsPart1:Full-textMetadata2016-05-23发布2016-07-01实施河北省质量技术监督局发布DB13/T2351.1—2016目次前言...........................................................................

2、.....II引言...............................................................................III1范围..............................................................................12规范性引用文件....................................................................13术语和定义..........

3、..............................................................14全文元数据的属性..................................................................25全文元数据模型....................................................................26全文元数据描述..........................................

4、..........................37全文元数据字典描述...............................................................148全文元数据扩展原则和方法.........................................................14附录A(规范性附录)标准文献全文结构化元数据代码集.................................15附录B(规范性附录)篇章条编号、表号和图号说明.........

5、............................16附录C(资料性附录)标准文献结构化全文元数据-字典描述..............................18参考文献............................................................................22IDB13/T2351.1—2016前言本部分按照GB/T1.1-2009给出的规则起草。DB13/T2351《标准文献结构化数据规范》包括了3部分:——第1部分:全文元数据;——第2部分:

6、指标元数据;——第3部分:元数据著录规则。本部分是第1部分,本部分与第3部分配套使用。本部分由河北省标准化研究院提出并归口。本部分起草单位:河北省标准化研究院。本部分主要起草人:施健、卢艳芳、马星晓、李朴、李建勋、谢燕、闫志强、张园园、陈南、赵倩、郭天强、安姣。IIDB13/T2351.1—2016引言标准文献电子文档格式有DOCX、数字版PDF、扫描版PDF。在生产、科研和管理过程中,往往需要定位到标准内容、指标信息上,如:检索标准指标、指标比对及标准水平分析等。但是,现有的标准文献电子文档为非结构化文档,这一特性决定它的内

7、容检索指向性笼统模糊,故而,以非结构化文档为单元存储无法实现小颗粒度的指标数据的检索、比对分析,只有通过数据处理将非结构化文档转换为结构化或半结构化文档方能解决上述问题。为寻求上述瓶颈的突破,河北省标准化研究院在2012年将标准文献结构化列为重点科研项目,在此基础上,2013年又承担了国家标准化委员会标准化信息中心的《“双打”重点产品标准文献结构化内容数据库》项目,而实现标准文献结构化必须首要解决2个问题:1)结构化标准的数据结构问题,换而言之,标准结构化加工抽取出的数据是哪些数据?2)对抽取出来的数据进行加工应符合什么样的数

8、据规范要求,方能满足与原始标准文本内容的一致性的需求。解决第一个问题,需要建立标准结构化数据模型,并通过元数据规范来实现;解决第二个问题,需要建立数据的著录规则,实现数据的规范性。项目组在确定文献结构化抽取技术的基础上,对4000余项强制性国家标准的内容要素逐一进行了分析研究

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。