ETL技术在地税数据集中项目中应用探析

ETL技术在地税数据集中项目中应用探析

ID:46048585

大小:59.13 KB

页数:5页

时间:2019-11-20

ETL技术在地税数据集中项目中应用探析_第1页
ETL技术在地税数据集中项目中应用探析_第2页
ETL技术在地税数据集中项目中应用探析_第3页
ETL技术在地税数据集中项目中应用探析_第4页
ETL技术在地税数据集中项目中应用探析_第5页
资源描述:

《ETL技术在地税数据集中项目中应用探析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、ETL技术在地税数据集中项目中应用探析摘要:随着国家稅务部门对涉稅数据精确化管理的需要,迫切要求将各级税务机关的征管数据汇总,并进行分析和预测。鉴于我省核心征管系统省、市两级部署,分散应用,所以在数据集成的过程中对数据的准确性和及时性要求比较严格,就必须使用ETL技术来实现三级数据的集成。关键词:ETL技术;税务部门;数据集成应用中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)21-5255-03ETLTechnologyinLandTaxDataCentralizedProjectTANGLia

2、ng(LocalTaxationBureauofAnhuiProvince,ElectronicTaxInformationManagementCenter,Hefei230061,China)Abstract:Alongwiththenationaltaxauthoritiesontaxdataaccuratemanagementneeds,requiresthetaxauthoritiesatalllevelsofadministrationanddatacollection,analysisandprediction.

3、Inviewofourprovincecorecollectionsystemofprovincialandmunicipallevels,deployment,distributedapplication,sothedataintegrationintheprocessofdataaccuracyandtimelinessrequirementsmorestringent,youmustuseETLtechnologytoachievelevelthreedataintegration.Keywords:ETLtechno

4、logy;taxdepartment;dataintegrationapplication为了加大地税系统数据向国家税务总局集中的力度,进一步提高税务系统税源监控和分析的能力,不断深化“信息管税”工作,国家税务总局于2010年5月底下发了《国家稅务总局关于做好抽取全国地方税务系统税收征管有关数据准备工作的通知》(国税函(2010)235号),要求各省地方税务部门做好数据抽取相关准备工作,为了推进这一项目的实施,我省于2012年1月〜3月启动了这项工作,经过近半年时间的施工和试运行,实现了全省17个市局核心征管数据的集中工作,

5、系统目前运行情况比较稳定。1系统功能本项目为了完成从17个市局征管系统抽取数据的功能,将系统分别从功能、数据、技术三个角度描述系统的设计内容。功能实现方面,系统提供配置管理、数据抽取、质量管控、系统管理四个功能域。数据存储方面,将源系统表、目标系统表、系统配置表归属到抽取数据层、目标数据层、控制数据层三个层面中。技术实现方面,系统按照分层的思想将系统划分为了数据层、控制层、展现层三个层面。数据层采用Oracle、Sybase等主流数据库以及ETL平台进行数据的实际存储和抽取;控制层采用先进的工作流技术,完成抽取流程的定制和控

6、制;展现层主要使用Ext/Flex等富客服端技术实现友好的客户界面。2ETL过程数据抽取过程是首先检查17个市局系统数据库中的数据合理性,检查正确后将数据抽取到抽取数据层。系统进一步根据控制数据层的内容对抽取数据层的数据进行转换,将转换后的结果加载到目标数据层,目标数据层的数据供总局进行数据抽取。上述过程构成一个数据抽取的流程作业,每个作业都可以配置自动后台执行或页面上手工抽取,在执行过程中的某个环节一旦出现异常时,将通过异常管理模块进行通知和干预。2.1数据检查环节在数据检查环节,主要从接口数据的正确性、及时性和完整性等三

7、个方面进行检查,同时根据入库是否异常、接收文件的时间等角度进行分析;对于业务应用系统的数据库接口,则主要从接口的及时性和一致性方面进行检查,通过比较源系统的相关指标,分析数据的可信度。2.2数据抽取环节数据抽取是指从数据源系统中获取数据,抽取策略包括抽取方式(增量、全量)、抽取周期等。系统支持多种不同系统平台和数据类型的数据抽取。包括各种关系型数据库系统和各种文件格式的源数据等。本次的数据抽取是从17个市局征管系统中把征管相关数据抽取到本系统的抽取数据层。每月初,系统17个市局征管系统将数据以数据文件的形式,完成全量复制;每

8、天通过数据库接口通过数据抽取工具以增量复制方式完成数据同步。2.3数据转换环节数据转换包括格式和类型数据的转换、数据翻译、数据匹配、数据聚合以及其它复杂的计算等。多数情况下,数据源到本系统之间主要的转换是格式转换、数据翻译、数据匹配。本次系统的数据转换主要是将各个数据源的数据按照国家税务总

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。