数据挖掘技术在税务系统数据分析上的应用

数据挖掘技术在税务系统数据分析上的应用

ID:33583072

大小:150.45 KB

页数:4页

时间:2019-02-27

数据挖掘技术在税务系统数据分析上的应用_第1页
数据挖掘技术在税务系统数据分析上的应用_第2页
数据挖掘技术在税务系统数据分析上的应用_第3页
数据挖掘技术在税务系统数据分析上的应用_第4页
资源描述:

《数据挖掘技术在税务系统数据分析上的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2010年第12卷第6期巢湖学院学报No.6.,Vol.12.2010总第105期JournalofChaohuCollegeGeneralSerialNo.105数据挖掘技术在税务系统数据分析上的应用曹骞1,2许磊3(1巢湖学院计算机系,安徽巢湖,238000)(2中国科技大学计算机学院,安徽合肥,230000)(3巢湖学院物理系,安徽巢湖,238000)摘要:本文主要介绍了巢湖市地税局税务系统的系统结构和关键技术。该系统主要运用数据仓库、ETL、数据挖掘等关键技术。关键字:数据分析系统;数据仓库;ETL中图分类号:TP311文献标识码:A文章编号:16

2、72-2868(2010)06-0017-041引言据库进行操作,对于数据的安全性和系统的安全巢湖市地税局税务系统管理中心以税务处性是一种潜在的威胁。怎样解决目前的问题呢?理系统为基础,开发了一系列的增值业务。随着方法是税务系统的基础上,构建一个能提供多种税务系统的运行,纳税企业税单越来越多,系统对数据深入分析方法,扩展当前系统使之具有灵累积的各种数据规模越来越大,累积的数据中包活简单的报表定制功能,同时为系统平台的安全含着丰富的有价值信息,能够帮助巢湖市地税局性提供完整的解决方案,为数据建立综合的税务更好的处理税务的征收,与税务的稽查。因此,在分析平台。

3、找出相关的数据的逻辑性,与关联性,管理中心的日常业务中,对税务系统中各种数据为税务的核查,提供相应的帮助,本文主要从总的各种分析需求已经逐渐显露出来。体设计、数据仓库建模、ETL、系统功能等方面来目前解决分析需求的办法是,需要有专门的论述,将系统建设重点放在内层数据仓库建设,技术人员对最底层的核心数据库进行手工操并在数据仓库分离分析和业务环境的基础上,建作,,用手工导出大量的相关的用户数据,税务记立一个基于Web的B/S架构的企业级数据分析录数据,然后通过相应的工具软件制作相应的报框架,满足本税务征收和税务稽查等部门的工作表。这样是能找出大量的数据,但是无

4、法对取得业务分析需求。的数据进行全面深入的分析,很难在海量的数据2总体设计中找到潜在的有价值的信息,同时操作复杂繁2.1体系结构琐,数据间的相关性很难找到,响应时间长,报表税务系统综合数据分析平台采用了基于浏制作周期长,容易出错,而且由于直接对底层数览器的三层结构(B/S架构),体系结构如图1所收稿日期:2010-08-20基金项目:巢湖学院自然科学研究资助项目(XLY-201012)作者简介:曹骞(1981-),男,安徽安庆人。巢湖学院计算机系教师,研究方向:数据挖掘。17示。系统需要定期(每周/月/季度/年)从业务系统年)对这些数据进行处理(汇总、聚合

5、、统计、分类(税务系统、税务部门网站服务器、系统日志等)等),同时应用服务器提供还提供相应的查询和里抽取分析平台所需要的分析数据,增量式地更分析的接口,对分析结果数据提供基于WEB的新税务系统综合数据仓库SMMAIL-DW,这部分展示的接口,最后应用服务器定期(每周/日/年)抽取工作对底层的原始数据的视图进行操作。保生成各类数据分析报表。WEB服务器端通过护了原始数据的安全性。SMMAIL-DW存储了以ASP.Net程序调用应用服务器的各种功能,用户客户为中心的特征数据和行为数据,以网页为中通过浏览器直接访问本系统。心的web访问数据等,应用服务器定期(每

6、周/日/纳税企业RDB税务分析E税务系统WEBT综合数据WEB分析Log应用L仓库系统运行分析Others系统管理原始数据数据仓库数据集市业务逻辑前端应用图12.2系统组成挖掘建模、结果显示等功能;根据上述体系结构,的整个系统组成如下所3)前端应用:包括纳税企业分析、税务分析、示:Web分析、系统运行分析、系统管理等功能。1)ETL:包括原始数据ETL、参数设置、系统3关键技术检错等功能;3.1数据仓库设计2)业务逻辑:包括数据处理、查询分析、数据数据仓库总体结构如图2:纳税企业分析用户税务分析订阅Detail帐单Web分析按周/月/季度/年汇总日志系统运

7、行分析原始数据数据仓库数据集市图2原始税务业务数据视图通过ETL程序自动息等维表。在数据仓库的基础上,为了满足各种导入到数据仓库中的事实表中。除了事实表,数数据分析需求,再为不同的分析主题中建立相应据仓库中还包括了企业信息、税单信息,账单信的数据集市。18对于数据仓库中的按月汇总的明细事实数度汇总的策略来保存历史数据,这样在明细表中据,由于其数据量会非常大,可以按照保持一个就可以始终保持一个时间周期的细节数据。如图时间周期(比如一年)之后自动按上一级时间粒3所示:税单维表企业维表时间维表网站访问维表Detail保持一定时间后汇总周汇总月汇总季度汇总年度汇总

8、保持一定时间后汇总保持一定时间后汇总保持一定时间后汇总保持一定时间

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。