欢迎来到天天文库
浏览记录
ID:52972351
大小:426.44 KB
页数:38页
时间:2020-04-05
《基于计算动词决策树股市数据分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于计算动词决策树的股市数据分析答辩人:刘夏莹学号:22220051204121指导老师:杨涛决策树小组的分工情况:周悦颖:传统决策树的动词化张娓娓:计算动词决策树的设计刘夏莹:基于计算动词决策树的股市数据分析动词决策树提出的背景:计算动词静态动态改进的ID3算法:更实用于计算动词决策树信息熵动词熵,信息增益动词信息增益根据当天的股票走势通过股票的动词决策树对第二天的股票走势进行预测。股票的交易费用买入价卖出价交易费用0.3%2股票的交易买空:在当天开盘时买入后在当天收盘时卖出,即以开盘价买入,收盘价卖出。则该天挣的钱为收盘价-开盘价-交易费用。卖空:在当天开盘
2、时卖出后在当天收盘时买入,即以开盘价卖出,收盘价买入。则该天挣的钱为开盘价-收盘价-交易费用。暂停:在当天不对股票进行交易。则该天挣的钱为0。股票的预测看多:预测第二天的股票走势为上升。看空:预测第二天的股票走势为下降。看平:预测第二天的股票走势为保持。开始求各组股票数据的相似度导入数据库DATAtree确定各天股票走势的对DATAtree初步处理并得正子类类型确顺序的数据库计算各子类的各种目标结果股票目标结果的确立的个数并进行比较得到股票的动词决策树求得各子类股票走势模板的模板值结束表一DATAtree=表二开始求各组股票数据的相似度导入数据库DATAtree确
3、定各天股票走势的对DATAtree初步处理并得正子类类型确顺序的数据库计算各子类的各种目标结果股票目标结果的确立的个数并进行比较得到股票的动词决策树求得各子类股票走势模板的模板值结束股票走势的初步分类假设当天股票数据出现的顺序为V1、V2、V3和V4并假设它们等时间间隔出现。V1为开盘价,V4为收盘价。V1V41997上升:当V4-V10.3%即V1V4时定义股22003票走势为上升,V2为最低价,V3为最高价。V1V42003下降:当V1-V40.3%即V1V4时定义股21997票走势为下降,V2为最高价,V3为最低价。V1V4V1V4199
4、72003保持:当0.3%V4-V10.3%即V4V1V42220031997时定义股票走势为保持,V2为最高价,V3为最低价。表三表四表五开始求各组股票数据的相似度导入数据库DATAtree确定各天股票走势的对DATAtree初步处理并得正子类类型确顺序的数据库计算各子类的各种目标结果股票目标结果的确立的个数并进行比较得到股票的动词决策树求得各子类股票走势模板的模板值结束股票目标结果的确立股票的目标结果是指对第二天股票走势的预测。表六表七开始求各组股票数据的相似度导入数据库DATAtree确定各天股票走势的对DATAtree初步处理并得正子类类型确顺
5、序的数据库计算各子类的各种目标结果股票目标结果的确立的个数并进行比较得到股票的动词决策树求得各子类股票走势模板的模板值结束假设有两点D1和D2,若要D1和D2的值完全相等,概率很小,所以我们定义若19972003时D1和D2相等。D2D1D2200319971997200319972003情况一:当V2V1V2并且V4V3V42003199720031997时;1997200319972003情况二:当V2V1V2并且V4V3V42003199720031997时;1997200319972003情况三:当V2V1V2
6、并且V4V3时;V42003199720031997情况四:当并且199720031997V4V32003时。2003V2V11997V220031997V4某子类模板的模板值依次为T1、T2、T3和T4。股票走势的模板值模板值算法一:平均值ⅰ、如果m=0,则该股票走势道德模板值为T1=0、T2=0、T3=0和T4=0。ⅱ、如果m>0,则求平均值模板值算法二:平均值和直方图ⅰ、如果m=0,则该股票走势道德模板值为T1=0、T2=0、T3=0和T4=0。ⅱ、当06时,该股票走势的模板
7、值的T1的算法如下:对1到m组股票数据中的G1做直方图,该直方图的区间为S,S为m/3后向最近整数取整后的整数。T1为该直方图中出现的个数最多的区间的中间值,若该直方图中个数最多的区间大于一个,则T1取中间值最小的那个。T2、T3和T4的求法如T1。模板值算法一表八开始求各组股票数据的相似度导入数据库DATAtree确定各天股票走势的对DATAtree初步处理并得正子类类型确顺序的数据库计算各子类的各种目标结果股票目标结果的确立的个数并进行比较得到股票的动词决策树求得各子类股票走势模板的模板值结束相似度算法相似度算法一:如果
此文档下载收益归作者所有