国家标准文档结构化置标

国家标准文档结构化置标

ID:38754622

大小:870.04 KB

页数:4页

时间:2019-06-18

国家标准文档结构化置标_第1页
国家标准文档结构化置标_第2页
国家标准文档结构化置标_第3页
国家标准文档结构化置标_第4页
资源描述:

《国家标准文档结构化置标》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2014,No.4STANDARDSCIENCE·ResearchonStandardApplication·国家标准文档结构化置标1221蒋碧蓉程永红王海涛荀恩东(1.北京语言大学;2.中国标准化研究院)摘 要:目前,国家标准文档主要以pdf或者word格式进行保存,且还有大量较早出版的标准文档只有纸质的形式,只能购买整篇文档进行阅读,用户很难及时获取及查询相关标准内容。另外,标准文档无法包含制修订过程信息,造成责任无法追溯。随着计算机和信息技术的发展,国家标准文档作为社会经济发展的基础和重要支撑,其技术革新的问题变得日益迫切和重要。本文全面考察了标准文档的结构,针对以

2、上问题提出了使用XML进行内容结构化的实验框架。关键词:国家标准XML结构化DOI编码:10.3969/j.issn.1674-5698.2014.04.009ResearchonNationalStandardswithStructuredXML1221JIANGBi-rongCHENGYong-hongWANGHai-taoXUNEn-dong(1.BeijingLanguageandCultureUniversity;2.ChinaNationalInstituteofStandardization)Abstract:Thenationalstandardsnowa

3、resavedinformatofpdforword,andtherearealargenumberofstandardspublishedearlieronlyindocuments.Usershavetobuythedocumenttoreadanditisdifficulttoaccesstoandinquirerelevantcontents.Inaddition,thestandarddocumentsdonotcontaintheprocessinformationofdevelopmentandrevision,resultinginthefailureof

4、traceresponsibility.Withthedevelopmentofcomputerandinformationtechnology,nationalstandards,asthebasisofsocialandeconomicdevelopment,thetechnicalinnovationofstandardshasbecomeincreasinglyurgentandimportant.Thispaperstudiesthestructureofstandarddocumentsandproposesanexperimentframeworkofsta

5、ndardizingcontentsbyusingXML.Keywords:standard,XML,structure.1引言中体现在以下几个方面:(1)标准信息资源总量差距大,时效性不强、国家标准主要形式包括纸质出版物和PDF层次低、加工水平低、信息粒度粗、信息质量差;(Word)格式文本。在信息技术日益发展、信息资(2)信息资源加工和技术手段落后,信息传递源日趋重要的当今社会,单纯的两种方式已经远远不不畅或者滞后;能满足社会对于国家标准信息的需求,大大限制了国(3)标准制定过程信息缺失,无法追溯责任;家标准服务社会的功能。(4)标准信息检索仍以简单的题录信息查询为目

6、前,我国标准工作在信息化方面的主要问题集主,只能满足于一般的应用和需求,尚未实现全文检基金项目:本文研究得到质检公益性行业科研专项(201210210)、中国标准化研究院院长基金项目(522013Y-3062)、国家科技支撑计划(2012BAH16F00)和自然科学基金(61170162)的资助。作者简介:蒋碧蓉,硕士,研究方向为中文信息处理。43·标准应用研究·标准科学2014年第4期索和知识查询,同国外信息技术发展形成鲜明反差。2.2使用XML进行国家标准文档结构化的主要困难因此,对国家标准文档进行结构化封装,使之更(1)颗粒度。标准文档的内容可能会非常庞利于存储、检

7、索和深度利用,更好地服务社会,这一杂,层级结构多。如果颗粒度定义得太细或者太粗,问题变得日益迫切和重要。都会导致封装的XML结构太过于复杂,且不利于存储可扩展标记语言(ExtensibleMarkupLanguage,XML),和检索,失去了结构化的意义。所以,这就需要准确用于标记电子文件使其具有结构性的标记语言,可以地定义结构层级和颗粒度,既能完整地包含原标准文用来标记数据、定义数据类型,是一种允许用户对自档的内容,又能充分体现出结构化的逻辑和条例,还己的标记语言进行定义的源语言。XML是标准通用有保证数据后期便于存储和查询

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。