数据质量评测方法与指标体系

数据质量评测方法与指标体系

ID:13400463

大小:10.04 MB

页数:30页

时间:2018-07-22

数据质量评测方法与指标体系_第1页
数据质量评测方法与指标体系_第2页
数据质量评测方法与指标体系_第3页
数据质量评测方法与指标体系_第4页
数据质量评测方法与指标体系_第5页
资源描述:

《数据质量评测方法与指标体系》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、项目编号INFO-115-C01文档编号TR-REC-064中国科学院数据应用环境建设与服务数据质量评测方法与指标体系(征求意见稿)中国科学院数据应用环境建设与服务项目组2009年9月7前言本规范是“中国科学院数据应用环境建设与服务”之标准规范建设成果之一。本规范由中国科学院计算机网络信息中心科学数据中心提出并归口。本规范由中国科学院计算机网络信息中心科学数据中心负责起草。7目录1范围42规范性引用文件43应用44术语45数据质量评测制度56数据质量评测原则56.1科学性原则56.2客观性原则56.3系统性原则5

2、6.4可操作性原则66.5针对性原则66.6引导性原则67数据质量评测一般流程67.1数据质量需求分析77.2确定评价对象及范围77.3选取数据质量维度及评价指标77.4确定质量测度及其评价方法87.5运用方法进行评价87.6结果分析及评级97.7质量结果及报告98数据质量评价主体的要求99数据质量指标体系109.1数据质量结构109.2主要数据质量指标119.2.1基本层129.2.2准则层139.2.3评价指标选取的基本要求169.2.4评价指标的筛选和权重169.2.5评测指标的冲突处理原则1710数据质量

3、评测方法1810.1定性方法1810.1.1第三方评测法1910.1.2用户反馈法1910.1.3专家评议法2010.2定量方法2010.2.1访问量统计2010.2.2计算机辅助检查2110.3综合方法2110.3.1层次分析法2110.3.2缺陷扣分法267数据质量评测方法与指标体系1范围本规范明确了用于中国科学院数据应用环境建设与服务项目中数据(资源)质量评测的一般方法与数据质量指标体系的建立方法。本规范所提供的流程、方法和指标可适用于中国科学院数据应用环境建设与服务项目中建库单位内部的产品质量评价,日常统

4、计监测制度,以及专家委员会领导下的项目质量检查。本规范提供的评测方法与指标体系适用于数据资源(包括中间产物),不包括对数据生产与服务过程的评测。2规范性引用文件下列文件对于本文件的引用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。TR‐REC‐061数据应用环境建设与服务标准规范框架3应用本规范所提供的流程、方法与指标均为通用性内容,意在面向不同规模、不同学科背景和不同数据类型的各类数据库提供适应性,在执行过程中评测方可根据实

5、际情况适当增删评测流程,并决定具体的指标体系和采样方法。4术语本规范所使用之术语遵循《TR‐REC‐061数据应用环境建设与服务标准规范框架》第七部分的约定。75数据质量评测制度为确保科学数据信息资源管理与使用的有效与安全,最大限度保障投资者的利益与建设者的劳动,促进科学数据资源的共享利用,“中国科学院数据应用环境建设与服务”项目要求项目内数据库应建立数据质量评测制度。“中国科学院数据应用环境建设与服务”项目资助建设的数据资源,应在项目结题前达到本规范提出的质量要求,并接受项目质量检查。此外,建库单位应当根据具体

6、情况适当开展以本标准为依据的日常数据质量监测统计。6数据质量评测原则科学数据质量评价应注重以下原则:6.1科学性原则质量评价的结果应能正确反映数据资源的质量状况。主要体现在正确的质量指标选择,以及采用科学合理的评价方法等方面。评价必须有一定的理论作为基础,但又不能够脱离实际。另外,科学性还反映适度的简单,评价不可能穷尽所有因素,也不能过于简单。6.2客观性原则评价应是符合实际、客观可信的。评价指标的选择须考虑当前数据资源环境的总体水平,反映出不同学科领域的差异。6.3系统性原则由于评价对象的广泛性、复杂性、必须使

7、用若干指标来衡量,同时指标间可能相互联系、相互制约。但是,在评价中,每个指标又必须是独立的,不互相包7容的,需考虑指标的层次性、系统性,避免指标间冲突。6.4可操作性原则科学合理的评价体系应该是可行的、操作方便的,指标的设计避免过于繁琐,还要考虑指标体系所涉及指标的量化及数据获取的难易程度和可靠性,注意选择能够反映科学数据质量状况的综合指标和具有代表性的指标。6.5针对性原则科学数据资源种类繁多,数据积累具有续性,各种资源除了具有与其他资源相同的共性之外,也具有其自身的特殊性。数据质量评价应能充分考虑各类科学数据

8、资源所特有的类型特征并能将其揭示出来,要在指标的权重和分值上予以区分,以体现其针对性的导向作用。6.6引导性原则进行科学数据质量评价,目的在于了解科学数据资源的质量情况,为有关的取舍提供判断依据,以帮助用户快速选择有针对性的信息。因此,必须以方便专业人员快捷而有效的选择和获取有价值的信息资源为导向。7数据质量评测一般流程科学数据质量评价过程是评价者将数据质量评价程序应用于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。