欢迎来到天天文库
浏览记录
ID:34159006
大小:414.40 KB
页数:4页
时间:2019-03-03
《基于bp神经网络的数据挖掘及在股价预测中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、实践与经验基于BP神经网络的数据挖掘及在股价预测中的应用孟毅,吕渭济(湛江师范学院商学院湛江524048)摘要:对BP网络的拓扑结构及其结构的确定进行分析,对如何提高网络的泛化能力和网络模型的合理化进行研究,给出一些具体方法和建议。结合以上的分析,利用BP网络对股票价格进行预测,所得结果表明,只要选择合理的网络模型和结构,其预测能力是相当可观的。关键词:BP网络结构;推广能力;过拟合;股票0引言量。输入变量即为系统待分析的外生变量(系统性能指标或因变量),可以是一个,也可以是多个。一般将近年来,神经网络被广泛用于时间序列分析和金一个具有多个输入的网络模型转化为多个具有一个融预报,这是因为神经网
2、络有较强的非线性函数逼近输出的网络模型效果会更好,训练也更方便。能力,可以根据样本数据训练得到输入输出变量之间由于BP神经网络的隐层一般采用Sigmoid转换的函数关系,即可以通过神经网络学习,确定各神经函数,为提高训练速度和灵敏性以及有效避开Sig-元之间的耦合权值,从而使得网络具有近似函数的功moid函数的饱和区,一般要求输入数据的值在0~1能,这样我们无需了解市场的内在动力机制,就可对之间。因此,要对输入数据进行预处理。一般要求对不其未来行为进行预测。同变量分别进行预处理,也可以对类似性质的变量进1样本数据行统一的预处理。如果输出层结点也采用Sigmoid转1.1换函数,输出变量也必须作
3、相应的预处理,否则,输出收集和整理分组变量也可以不做预处理。采用网络方法建模的首要前提条件是有足够多预处理的方法有多种多样,各文献采用的公式也有典型性和精度高的样本,而且,为监控训练(学习)不尽相同。但必须注意的是,预处理的数据训练完成过程使之不发生“过拟合”(overfitting)和评价建立的后,网络输出的结果要进行反变换才能得到实际值。网络模型的性能和泛化能力,必须将收集到的数据随再者,为保证建立的模型具有一定的外推能力,最好机分成训练样本、检验样本(10%以上)和测试样本[3]使数据预处理后的值在0.2~0.8之间。(30%以上)3部分。此外,数据分组时还应尽可能考虑样本模式间的平衡。
4、2网络拓扑结构的确定现1.2输入输出变量的确定及其数据的预处理代关于网络结构,我们想研究的是:在训练样本数计一般地,BP网络的输入输出变量即为待分析系量和质量一定时,如何确定网络结构以保证有良好的算统的内生变量(影响因之或自变量)数,应根据专业知推广能力。机识确定。若输入变量较多,一般可以通过主成分分析网络结构涉及到以下几个方面的内容:隐层的层(方法压减输入变量,也可以根据剔除某一变量引起的总数及隐层的结点数、初始权值、激励函数、学习率、动第系统误差与原系统误差的比值的大小来压减输入变量因之、误差精度。三○收稿日期:2008-11-19修稿日期:2009-02-14一期作者简介:孟毅(1982
5、-),女,辽宁人,硕士,助教,研究方向为时间序列分析、信息管理与信息系统)貋貖貧MODERNCOMPUTER2009.2实践与经验2.1隐层数理的BP网络模型并通过向所给的有限个样本的学Hornik等已证明[2]:若输入层和输出层采用线性习(训练)来满意地逼近样本所蕴含的规律(函数关转换函数,隐层采用Sigmoid转换函数,则含一个隐系,不仅仅是使训练样本的误差达到很小)的问题,目层的MLP网络能够以任意精度逼近任何有理函数。前在很大程度上还需要依靠经验知识和设计者的经显然,这是一个存在性结论。在设计BP网络时可参验。因此,通过训练样本的学习(训练)建立合理的BP考这一点,应优先考虑3层BP网
6、络(即有1个隐层)。神经网络模型的过程,在国外被称为“艺术创造的过一般地,靠增加隐层结点数来获得较低的误差,其训程”,是一个复杂而又十分烦琐和困难的过程。练效果要比增加隐层数更容易实现。对于没有隐层的由于BP网络采用误差反传算法,其实质是一个神经网络模型,实际上就是一个线性或非线性(取决无约束的非线性最优化计算过程,在网络结构较大时于输出层采用线性或非线性转换函数形式)回归模不仅计算时间长,而且很容易陷入局部极小点而得不型。因此,一般认为,应将不含隐层的网络模型归入回到最优结果。目前虽已有改进BP法、遗传算法(GA)归分析中,技术已很成熟,没有必要在神经网络理论和模拟退火算法等多种优化方法用于
7、BP网络的训中再讨论之。练(这些方法从原理上讲可通过调整某些参数求得全2.2隐层结点数局极小点),但在应用中,这些参数的调整往往因问题隐层结点的选择与其说具有科学性,不如说更具不同而异,较难求得全局极小点。这些方法中应用最技巧性。往往与输入数据中隐含的特征因素有关。网广的是增加了冲量(动量)项的改进BP算法。络初次训练前所有参数的选择权值都是初步数,至今3.2学习率和冲量系数得不到一个统一的规范。
此文档下载收益归作者所有