欢迎来到天天文库
浏览记录
ID:10165183
大小:28.00 KB
页数:6页
时间:2018-06-12
《浅谈企业数据管理的需求及建议》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浅谈企业数据管理的需求及建议摘要:本文讲述了企业数据管理包含的内容,浅析企业数据管理的四方面需求,提出企业数据管理存在的问题及改进建议。关键词:结构化数据;非结构化数据;内容管理中图分类号:TP311.13随着网络技术的发展,企业信息呈爆炸式增长,数据资产成为企业最具价值的无形资产。数据管理分为结构化数据和非结构化数据管理。结构化数据即行数据指存储在数据库里,可以用二维表结构来逻辑表达实现的数据;非结构化数据相对于结构化数据而言,不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、图片等。据ForrestResearch的统计资料表明,企业20%左右的信息有效地存
2、储在各种类型的结构化数据库中,但是还有80%非结构化信息分散在整个业务过程及外部环境中,非结构化数据已成为企业数据的主体。1企业内容管理概念企业内容管理(EnterpriseContent6Management)是指对组织机构内部多种格式和媒体类型的信息资源(通常称为信息资产)的组织、分类、管理等有序化过程,常常作为数字图书馆或企业知识管理的一个组成部分。企业内容管理是随着数据管理的发展而为客户提供的一种应用软件,它管理、集成和访问从音频、视频到扫描图像的各种格式的商业信息。内容管理处理的对象范围比传统关系数据库管理系统处理的结构化数据更广,除了一般文字、文档、多媒体、流媒
3、体外,还包括Web网页、广告、程序(如JavaScript)、软件等一切数字资产,即所有结构化的数据和非结构化的文档。内容管理重点解决各种非结构化或半结构化的数字资源的采集、管理、利用、传递和增值,并集成到结构化数据的信息系统中,如ERP、CRM等,从而为这些应用系统提供更加广泛的数据来源。2企业数据管理需求对国内大型企业非结构化数据应用现状的调研结果,结合AIIM、Garnter等权威机构对内容管理业务领域的研究,总结企业非结构化数据管理需求如下:2.1数据统一存储需求针对大型企业内各业务应用系统基本采用分散存储各自非结构化数据的应用现状,需要通过建设非结构化数据管理平台
4、,建立企业内部大数据量的非结构化数据存储中心,同时需要通过制订存储优化策略达到优化存储结构,达到将企业内的非结构化数据进行集中存储,简化企业内部的IT架构、减少数据安全控制点,提升企业核心业务系统总体性能。2.2数据集中管理需求6非结构化数据管理平台不仅是企业内非结构化数据的存储中心,也是各项非结构化数据管理标准的制订者与实践者。通过制订各种非结构化数据管理标准,解决目前在非结构化数据管理上所存在的主要问题,满足企业内非结构化数据集中管理的需求,如通过建立内容元数据管理标准、数据全局访问标准、数据归集标准等。2.3全生命周期管理需求全生命周期管理是指内容的创建、申请、审核、
5、生效、分发、退休到销毁的全生命周期过程。它的基础是统一的版本管理、统一的存储管理和统一的权限控制。实现方式一种是根据内容的状态来控制全生命周期过程,另外一种是结合工作流。通过工作流和版本管理、存储管理和权限管理的结合,实现更丰富多样的全生命周期管理过程。2.4多类型应用系统接入需求目前,在大型企业内的业务系统存在业务逻辑多样性、所采用的开发技术多样性的特点,如基于SAP开发、基于J2EE开发等。因此平台需要为不同类型的业务应用系统提供整体接入解决方案以及与之配套的相关接入规范等。3企业数据管理的问题及建议由于非结构化数据格式多样、存储分散、总量大、增长速度快等特性,给企业数
6、据管理造成许多困难,下面浅谈企业数据管理存在的问题及建议:63.1数据共享协作困难问题:各业务应用间数据交互过程不可管控,交换方式不统一,交互效率低,部分采取线下作业,增加了人工作业的工作量。建议:增强各业务应用间非结构化数据的交互集成,提升数据的横向和纵向交互能力,减少线下的数据交互。3.2无全局访问机制问题:目前电子文档搜索机制均由业务应用单独进行,未形成面向全局的文档访问能力,导致电子文档交互困难,无法提升用户工作效率。建议:通过对电子文档的集中存储,提供高效的全局访问能力。3.3存储方式多样性,不利管理问题:各业务应用数据存储方式多样性,不利于管理,项目建设中无形增
7、加历史数据迁移工作的难度。建议:建立集中统一的海量内容库,对内容进行压缩存储管理;建立自动化、智能化持续优化存储非结构化数据的技术架构。3.4数据分散孤立,不利数据挖掘问题:没有建立基于业务的数据共享机制,信息孤岛现象严重,难以形成数据信息知识的价值链。6建议:统一存储非结构化数据,提升对非结构化数据的处理能力,特别是数据加工和挖掘的能力,从中获取重要信息,实现由数据到信息再到知识的过程。3.5版本不一致问题:不同数据源中的存在版本不一致、多个版本情况,在应用时难以获取最准确的版本数据。建议:统一数据来源和版本控制
此文档下载收益归作者所有