基于改进的bp神经网络税收预测模型的研究

基于改进的bp神经网络税收预测模型的研究

ID:24279271

大小:75.50 KB

页数:4页

时间:2018-11-13

基于改进的bp神经网络税收预测模型的研究_第1页
基于改进的bp神经网络税收预测模型的研究_第2页
基于改进的bp神经网络税收预测模型的研究_第3页
基于改进的bp神经网络税收预测模型的研究_第4页
资源描述:

《基于改进的bp神经网络税收预测模型的研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于改进的BP神经网络税收预测模型的研究刘东丽史卫亚河南工业大学摘要:因为税收数据的非线性、冗余性等特点,传统的税收预测模型的精度都不高。为了提高税收预测的精度,提出了一种主成分分析和BP神经网络相结合的税收预测模型。首先利用主成分分析法对影响税收的8个因子进行处理,消除重复的信息,结果保留了2个主成分作为神经网络的输入,达到了降维的目的,加快了网络训练的收敛速度。然后用BP网络对样本进行训练,仿真结果表明,通过不同模型之间的对比,发现PCA-BPNN模型的预测精度更高,可用性更好,是一种高效的预测方法。关键词:主成分分析;BP神经网络;税收预测;作者简介:刘东丽,女,汉,河南省商丘市

2、,硕士研究生,主要研究方向是机器学习作者简介:史卫亚,男,汉,河南哲周口市,副教授,硕士研究生导师,主要研究领域是机器学习、人工智能和模式识别1.引言税收预测是政府预算的第一步,同时也是期末进行财政分析以及制定下期财政预算的前提。长期以来,税收预测一直是我国税收计划中的重要组成部分,因此,精确、科学的税收预测对正确制定税收计划有着重耍的意义。目前,国内外学者对税收预测的研究方法主要有:基于线性回归、时间序列分析方法和神经网络方法m等。利用线性冋归法建立模型有严格的条件限制,它仅适用于具有特定的函数关系。而实际问题屮的b变量和因变量的关系更为复杂,税收的影响因子也是多方而的,且各因子之间

3、呈现的是非线性的特点,因此该方法预测的精度不高m。由于神经网络具有自学习、自适应和较强地非线性映射能力,且理论体系和学习机制比较完善,成为目前使用较广泛的一种算法模型。但传统的神经网络存在极易陷入局部极小值、收敛速度慢、网络稳定性较差等缺点,导致预测结果也不理想[3][4]。本文针对传统税收预测方法存在的问题,提出了一种主成分分析和BP神经网络相结合的税收预测模型。结果表明,该模型具有一定的可用性。1.主成分分析和BP神经网络2.1主成分分析法在税收预测中,影响税收的因子是多方面的,且这些因子之间存在着高度的相关性,乂由于输入变量数目较多,进而会影响税收预测模型的精度和程序运行的效率,

4、主成分分析法可以很好地解决这个问题。主成分分析法是将原来众多具有一定相关性的指标重新组合成一组新的线性无关的综合指标m。运用主成分分析法,不仅可消除数据间的冗余,保留原变量的主要信息且变量之间两两相互独立,同时还能实现简化输入变量维数的目的。即用少量的变量来代替原来的全部变量,且乂能涵盖原数据的大部分内容。2.2BP神经网络由于BP神经网络具有很强地自适应、自学习、非线性映射能力,II理论体系和学习机制比较完善,成为目前使用最广泛的一种神经网络算法模型。一个典型的BP神经网络包括三层:输入层、隐含层、输出层,各层之间全连接,同层之间无连接M。该网络的主要特点是信号前向传递,误差反向传播

5、。在前向传播中,输入信号从输入层经隐含层逐层处理,直至输出层,若实际值与期望值误差较大,就会转入误差反向传播阶段。这吋会按照误差梯度下降的方法从输出层经各个隐含层并逐层不断地调整各神经元的连接权值和阈值,反复迭代,直到网络输出的误差减少到预先设定的学习次数为止m。2.PCA-BPNN的税收预测3.1BPNN模型指标体系的建立因为影响税收的因素是多方面的,在参考已有文献的棊础上,本文挑选丫具有代表性的八个主要指标,分别为:国内生产总值(XI)、固定资产投资(X2)、进出口总额(X3)、财政支出总额(X4)、社会消费品零售总额(X5)、城乡存储存款年末余额(X6)、第一产业增加值(X7)、

6、商品零售价格指数(X8)。木文选取1995—2012年的数据作为训练样本,2013—2015年的数据作为测试样本。(数据源于《屮国统计年鉴》)。由于数据变化范围波动较大,因此,为了得到较好的训练效果,需耍对样本数据进行预处理。本文选用线性函数转换法对数据进行归一化[8],计其中,x是原数I据.是归一化后的数据,、分别是原数据中的最大值和最小值。本文选用3层BP神经网络建立预测模型。隐含层转移传输函数采用Sigmoid函数,输出层传递函数釆用线性函数。为提高网络的稳定性,设定学习算法为LM算法。3.2主成分分析本文使用SPSS22软件,对样本数据进行相关性分析,相关系数见表1。由表1知:

7、各变量间存在很大程度的和关性,即它们存在信息的重复,有必要对影响税收的因子进行主成分分析消除冗余,只保留贡献率较大的影响因子。由表2知,前两个主成分的贡献率已达到98.779%,即前两个主成分的综合指标基本涵盖了原数据的全部内容。表1相关系数矩阵下载原表表2主成分特征值和贡献率下载原表3.3PCA-BPNN的实现从表2知,可以用这两个成分作为输入对BP网络进行训练,税收为模型预测值。为了验证PCA-BPNN模型的好坏,木文选取了参比模型,时间序

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。