欢迎来到天天文库
浏览记录
ID:33730824
大小:3.93 MB
页数:70页
时间:2019-02-28
《基于web的商业智能系统在社保行业的实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、东北大学硕士学位论文第五章ETL过程与实现数据到源数据存放区,我们的程序会自动处理存放区的文件,处理结束后将文件转移到SUCCESS文件夹,否则转入error文件夹,由管理员处理。5.4.1Adapter的设计与实现一数据抽取与转换本系统的源数据来源于业务人员个人电脑上保存的相关文件。养老保险部分数据为MicrosoftVisualFoxPro的DBF文件,包括基本险缴费、养老金发放、企业年金、遗属补贴等不同结构的DBF文件。针对这部分数据的主要特点,我们设计一个通用的数据抽取与转换程序程序(Adap
2、ter),这个Adapter能够对所有DBF文件进行处理,将其导入DB2数据库中。在导入的过程中进行相应的处理即数据的转换,修改不合理数据(如日期为2月30日),过滤脏数据(如将null转换成0)等等。Adapter采用JAVA语言+XML(TheExtensibleMarkupLanguage)技术实现。JAVA语言用来实现Adapter的具体编码;XML作为配置文件,定义从源数据抽取数据的字段,目标数据库对应表、字段。由于JAVA语言与XML都是与平台无关的语言,可以“一次开发,到处运行”,Ada
3、pter可以应用在以后的与DBF文件有关的、任何平台的项目中,用来处理不同格式的DBF文件,将其导成文本文件或导入指定数据库中。Adapter的结构与作用见图5.2。图5.2Adapter结构与作用Fig.5.2Adapterstructureandfunction如图5.2所示:(1)[]q60Adapter读取DBF部分,采用基于HXTT(HongxinTechnology&TradeLtd)公司读取DBF的JDBC驱动;(2)图中②Adaptcr连接DB2数据库部分,采用IBM公司连接DB2的标
4、准JDBC驱动。东北大学硕士学位论文第五章功【L过程与实现Adapter的具体实现如图5.3所示。图5.3Adapter结构类图Fig.5.3AdapterclassstructureAdapter的JAVA程序主要包括三个包,Tools包用来处理数据转换,如:处理源数据中的空串、合理化日期格式、过滤空串等等:DBConn包存放数据库连接信息;ETL包为具体实现部分,首先从XML文件中读入数据的相关信息,然后调用DBConn包中的数据库连接方法,连接到DBF文件和DB2数据库,最后调用exceData
5、base0方法将数据合理转换后,抽取到DB2数据库中。Config.砌l存储的是源数据和目标数据库的信息。以基本险缴费部分配置文件为例,代码如下:主要定义规则的年份,源数据和目标数据库相对应的表、字段名称。东北大学硕士学位论文第五章ETL过程与实现jbxl99301,jbxl99302</table>脑编号,zhdn_9
6、3,zhlj_93,zhlj_939</field></source>ods.jbx</table>dnbh,ZHDN,ZHLJ,ZHLJ_G</field>01,02</unit></tHget></database>由于我们这次项目数据仓库采用的产品是mM公司的DB2,数据库连接信息在Adapter中直接写入JAVA程序中。实际项目中应用的数据仓库产品很多,各大数据库厂商都有自己的数据仓库,只要将数据库连接这部分信息提取到XML配7、置文件中。对于不同的数据可只需修改数据库连接的配置文件,即可实现针对各种数据库通用的Adapter了。5.4.2数据装载与转换的实现上一节中我们介绍了数据的抽取与转换,这一节介绍数据的转载与转换。可以看出数据的转换贯穿于从源数据到数据仓库的整个过程。分散的进行数据转换可以减轻系统的负载,提高效率。这部分主要是采用存储过程来实现的。数据经过了抽取过程,全部数据由DBF源数据导入到DB2中,剩下的工作就是在DB2内部,继续完成数据转换过程,并装载到数据仓库中。以养老金发放部分为例,详细说明存储过程的结构。8、养老金发放部分有两个事实表(如图4.4:fact.yljl,fact.ylj2)。存储过程主要就是向这两个表中加载数据,数据的转换也主要集中在这部分。维表的数据加载相对于事实表要简单得多,就不再进行描述了。处理养老金发放事实表的代码如下:createprocedureeⅡ.yIjOuterror_.codeint,outerrorlabelchar(SO))一目标:建立养老金的主题数据一接口参数含义:一-error_codeSQL语句执行过程中产生的错误 当前文档最多预览五页,下载文档查看全文 侵权申诉 举报 1 1 2 3 4 5 / 70 此文档下载收益归作者所有 下载文档 当前文档最多预览五页,下载文档查看全文 点击下载本文档 版权提示 下载文档 举报 温馨提示: 1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。 2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。 3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。 4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。 相关文章 更多 基于web的远程智能答疑系统的研究与实现 基于web的智能视频监控系统设计与实现 基于web的智能答疑系统与自测系统的设计与实现 基于web的药品行业诚信系统的设计与实现 基于web编程的智能无线点餐系统的设计与实现 基于web的面向模具行业的pdm系统的研究与实现 基于Mondrian在商业智能系统的设计与实现.pdf 基于web的商业地产管理系统的设计与实现 基于Web的多智能体系统实验平台的设计与实现 基于WebService的智能仓储管理系统的研究与实现.pdf 相关标签 商业智能 社保 基于 系统 实现 行业
7、置文件中。对于不同的数据可只需修改数据库连接的配置文件,即可实现针对各种数据库通用的Adapter了。5.4.2数据装载与转换的实现上一节中我们介绍了数据的抽取与转换,这一节介绍数据的转载与转换。可以看出数据的转换贯穿于从源数据到数据仓库的整个过程。分散的进行数据转换可以减轻系统的负载,提高效率。这部分主要是采用存储过程来实现的。数据经过了抽取过程,全部数据由DBF源数据导入到DB2中,剩下的工作就是在DB2内部,继续完成数据转换过程,并装载到数据仓库中。以养老金发放部分为例,详细说明存储过程的结构。
8、养老金发放部分有两个事实表(如图4.4:fact.yljl,fact.ylj2)。存储过程主要就是向这两个表中加载数据,数据的转换也主要集中在这部分。维表的数据加载相对于事实表要简单得多,就不再进行描述了。处理养老金发放事实表的代码如下:createprocedureeⅡ.yIjOuterror_.codeint,outerrorlabelchar(SO))一目标:建立养老金的主题数据一接口参数含义:一-error_codeSQL语句执行过程中产生的错误
此文档下载收益归作者所有