资源描述:
《电子文件元数据自动采集的原则和实施路径研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、电子文件元数据自动采集的原则和实施路径研究ok3etadata)包括“识别、认证文件和文件背景关联等信息以及生成、管理、维护和使用文件的人员、流程和系统的信息,文件管理政策”。只有伴有界定了关键特征元数据的文件才是真实有效的文件,这些特征必须被清晰地记录下来。元数据在文件捕获点上对文件进行详细说明,固化文件与其业务背景的关联,对文件实施管理控制。在整个生命周期中,新的元数据不断伴随业务的开展、提供利用而持续增加,以长期保证真实性、完整性、可靠性、可用性,使得对文件的管理成为可能。在电子文件管理系统中必须实现元数据的有效管理。电子文件管理系统(ERMS)作为专门用于对文件的维护和处置
2、予以管理的系统,具有如下属性:在背景中生成文件;管理和维护文件;依据要求的时间长度维护文件;文件管理元数据要可以设定。作为描述文件背景、内容、结构及其整个管理过程的数据,元数据最大的特征是动态性,动态地再现文件生成、流转、管理的全过程,在整个生命周期中为电子文件(包括由此转化而成的电子档案)的真实、完整、可靠、可用保驾护航。元数据的重要价值在于还原文件的背景信息,反映其所生成的政策法规和技术环境,显示与其他文件以及业务行为责任者等的各种关系,克服电子文件虚拟存在的局限。可见,元数据记录和反映的这些错综复杂、动态变化的信息已经无法仅仅依靠手工进行记录,必须嵌入系统,由系统自动判断、计
3、算与识别,实现系统自动采集元数据是元数据自身管理的要求。(2)机构业务需求电子文件的特点决定了对元数据的采集必须前置,由前端形成机构伴随业务活动的开展和其间文件的形成进行采集与管理。《文书类电子文件元数据方案》(以下简称《元数据方案》)给出了88项元数据元素,其中80%需要形成机构进行采集,而且过程性元数据需要反复着录,侧重记录电子文件生成的技术环境与业务过程信息,所涉问题难度大且较复杂。特别是《元数据方案》中规定的一些元数据项存在“宏观”或“笼统”的情况,比如元数据中“日期”项,如不结合文件生成、运转、处置的流程予以细化,则无法确定采集节点和采集方式;仅从文件生成流程来看,面临着
4、起草、会商、审核、签发等诸多“日期”,哪些日期最为关键、哪些应作为元数据予以采集、在文件生命周期中是否重复元数据以及如何采集等,都需要结合机构业务流程和相关规范深入研究,并实施精细化管理。对文件形成机构(即业务机构)而言,因为元数据管理而徒增繁重手工着录工作量,造成人力物力财力的巨大浪费,进而影响机构工作效率与绩效。需要指出的是,元数据并不是独立的,而是与机构自身电子文件管理基础密不可分。没有科学的电子文件、档案一体化全程管理流程,没有完备的电子文件元数据管理功能要求,便无法构建完善的元数[1][2]下一页据管理方案。因此,本文的研究内容是综合性的,从狭义来讲是电子公文元数据自动采
5、集方案;从广义来讲是机构电子文件管理方案。二、元数据自动采集原则(1)基于档案管理的基本原则1.来源原则。元数据采集虽然通过对电子文件信息加以采集、提炼、分析和组织,揭示文件、档案的内容及其产生规律,但是仍然以尊重档案的本质属性和规律为前提,在采集时注重体现电子文件来源,使机构中同一来源的电子文件通过元数据采集得到集中反映,使元数据与档案的来源相联系,以此通过元数据揭示同一来源的档案、文件之间的各种联系,为档案、文件的理解与利用提供来源方面的背景信息。2.有机联系原则。有机联系原则也是档案管理的基本原则,是指系统中文件及组成系统的诸要素之间需保持时空上的相互联系。由于电子文件是以二
6、进制代码的形式分散存在于计算机之中,因此保持文件之间的有机联系显得尤为重要,而要保持这种有机联系,必须依赖于元数据。以此原则为导向的元数据采集实质上就是电子文件信息的系统化增值过程,其目的是把分散的文件信息转化为互相联系、系统的信息流,形成更高级的信息产品,满足用户的特定利用需求。通过元数据采集与管理过程,使大量文件特征信息加以系统化和组织化,有效控制档案、文件信息揭示的数量和质量,克服档案、文件查询和利用的困难,提高检索效率,节省查询成本和精力耗费,实现价值增益。(2)基于电子文件管理的原则1.前端控制原则。就元数据采集来说,在已经建立了电子文件管理系统的机构,电子文件在系统中生
7、成、运转,电子文件元数据采集的前端“超前”至系统的设计阶段,前端控制的形式也部分转移到系统功能的设计之中,即尽可能地把文件生命周期各个阶段的元数据需求设计在系统之中,以功能合理的OA系统作为管好电子文件的先决条件。