元数据管理方案

元数据管理方案

ID:39239534

大小:27.76 KB

页数:6页

时间:2019-06-28

元数据管理方案_第1页
元数据管理方案_第2页
元数据管理方案_第3页
元数据管理方案_第4页
元数据管理方案_第5页
资源描述:

《元数据管理方案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、元数据管理方案1.1元数据抽取为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。通过元数据自动抽取,用户可以方便、快捷地获得大量的元数据信息。1.1.1抽取的对象元数据抽取主要针对的对象有以下几种:l已有目录:已建业务应用系统中现有的目录资源。l数据库:各种数据库资源,包括关系型数据库、XML数据库等。l格式化电子文件:电子文件,例如Word、PDF、XLS等文件。1.1.2元数据抽取的流程元数据抽取的流程有4个主要步骤,分别为:l数据源信息获取:解决要从哪个数据源获得元数据的问题。l内容/结构分析:解决要从数据源中获得哪些

2、元数据的问题。l元数据提取:解决如何从数据源中获取元数据的问题。l存储入库:解决元数据存储的问题。1.1.3电子文档的元数据抽取对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理。针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程:l整理归档对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统一整理,根据公开共享的前提进行集中,这种集中可以是物理上集中的,也可以是逻辑上集

3、中的。但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目。各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的。在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可。l根据安全级别,建立相应的访问机制由于受到安全级别的限制,所以对于需要共享的数据要进行安全方面的限制,限制的手段可以有:用户名/密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。l编目处理现阶段,主流格式

4、的电子文档,主要包含:word、excel、ppt、pdf等。对主流格式的电子文档,要提供自动采集工具进行编目处理。采集的范围主要是文档的标题和内容,对于其它的元数据内容,要提供手工配置的方式进行辅助。另外,在工具的采集效率上,要提高增量文档发布后的采集效率。对于格式特殊、内容有加密算法的文档,是很难通过抓取工具进行采集的,这些文档主要通过手工编目的方式来处理。对于存在管理库的文档,就需要对数据库来进行编目采集,详见数据库元数据抽取部分。l保存元数据采集后的数据要放到数据库或者保存到硬盘上,另外要根据目录体系标准,把数据分解为元数据,然后进行

5、存储1.1.1数据库元数据抽取数据中心需要抽取的数据库类型主要为Sqlserver,首先利用ETL工具从源数据库中将所需数据抽取至中心数据库基础业务库中,在利用元数据著录工具对抽取出来的数据进行元数据著录。1.1元数据著录根据《元数据标准》定义的元数据项,提供著录界面,针对每一个著录项的特点,提供文本框、列表框、复选框等录入形式。l元数据内容录入元数据内容录入用于元数据内容的录入处理,根据元数据库对各类信息元数据的定义,帮助和引导录入人员建立符合要求的信息资源元数据。元数据内容录入动态地完成编辑元数据所需的处理,包括元素内容编辑组件动态生成、

6、元素关系自动关联和元素值域检查等。其中编辑组件动态生成功能根据元数据标准定义的元素数据类型和取值方式动态地确定界面编辑组件的形式,使界面极具友好性;元素关系自动关联保证了元素之间的约束关系能够被编辑器自动的处理,减少了由于编辑人员对标准的理解错误而产生元数据结构错误的可能;元素值域检查可对用户输入的数据的有效性进行判断,以确保元数据信息内容的正确性。l标准逻辑分析元数据采集系统对描述元素的处理不依赖于特定的元数据标准,也就是说采集系统对元数据标准逻辑的分析和处理是独立于标准本身的。采集系统的标准逻辑分析功能通过元数据标准的XML描述获得元素之

7、间的制约关系、值域等处理逻辑。因此编辑器可以很好的适应标准的不断更新和升级。l元数据完整性检查为保证元数据的完整性,编辑器提供了元数据完整性检查功能。利用该功能,编辑器可以在输出文档之前对各个描述元素的组织关系、元素内容的完整性加以检查,发现编辑过程中可能遗留的问题,并提示用户加以修正。通过完整性检查的元数据将严格复合相应元数据内容标准所做的规定。l联机帮助处理用于完成系统联机帮助的查询、显示操作。1.2元数据审核元数据审核主要用于元数据报送到数据中心接收数据库但还没正式发布到发布数据库的元数据。元数据有效性审核分为自动审核与手动审核两个部分

8、,数据在接受报送系统报送数据时会启动自动审核系统对数据进行初步的有效性审核,主要以过滤数据结构性错误为主,例如缺少字段、类型错误、编码缺失或不可识别字符编码等。如果

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。