欢迎来到天天文库
浏览记录
ID:47308265
大小:804.61 KB
页数:24页
时间:2020-01-06
《人工智能研究报告:多周期机器学习选股模型》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、目录索引一、问题背景4二、策略原理与流程42.1特定训练窗口长度的机器学习模型42.2极限梯度提升树62.3机器学习股票收益率预测模型72.4策略回测设置8三、实证分析83.1机器学习模型因子筛选83.2不同训练窗口长度的模型表现123.3策略在不同调仓周期下的表现183.4多模型集成策略的表现22四、总结与展望24风险提示24图表索引图1:不同训练窗口的选股模型5图2:机器学习选股框架6图3:XGBoost模型求解示意图7图4:不同训练窗口长度的模型预测准确度13图5:模型S的IC13图6:模型M的IC14图7:模型L的IC14图8:模型IC的衰减情况1
2、5图9:模型年化ICIR的衰减情况15图10:模型S周度调仓选股表现16图11:模型M月度调仓选股表现17图12:模型L季度调仓选股表现18图13:模型S不同调仓周期选股表现19图14:模型M不同调仓周期选股表现20图15:模型L不同调仓周期选股表现21图16:机器学习多模型集成策略选股表现22图17:多模型集成策略的IC与预测窗口长度的关系23表1:候选风格因子8表2:不同预测周期的因子IC10表3:模型S周度调仓策略分年度表现16表4:模型M月度调仓策略分年度表现17表5:模型L季度调仓策略分年度表现18表6:模型S不同周期策略表现汇总19表7:模型M
3、不同周期策略表现汇总20表8:模型L不同周期策略表现汇总21表9:不同调仓频率下模型夏普比率比较21表10:不同模型股票收益率预测打分相关性22表11:多模型集成周度调仓策略分年度表现23表12:不同周期机器学习选股模型对冲表现23一、问题背景信息具有时效性。一般而言,选股因子对股票收益率的预测能力会随着时间的延后而不断衰减。由于不同因子中蕴含的股票信息有差异,不同因子对股票未来收益率的最佳预测窗口的长度也不一样。一般而言,高频价量信息反映股票短期的走势,对股票短期表现的预测能力较强,而估值、盈利等基本面信息反映股票长期的价格扭曲,对股票中长期表现的预测能
4、力较强。机器学习股票收益预测模型的目标是将股票因子与股票未来收益率关联起来。股票因子蕴含的信息决定了模型的预测能力,包括预测准确度和预测窗口长度。如果机器学习模型所用的股票因子中包含的是市场短期情绪面的信息,那么训练出来的机器学习模型可能对市场短期走势的预测能力较强;如果机器学习模型所用的因子包含的是市场中长期的价格扭曲信息,那么训练出来的机器学习模型可能对市场中长期的预测能力较强。本报告主要解决以下问题:1)如何构建适用于特定预测窗口长度的机器学习选股模型。本报告考察了常用的风格因子和技术指标,尝试按照因子在不同预测窗口长度的IC将选股因子分成不同的组别
5、,并针对不同的股票收益率预测问题,分别采用XGBoost模型构建机器学习预测模型。实证分析表明机器学习模型在不同预测窗口长度的股票收益率预测上都能够取得不错的效果,基于不同机器学习模型构建的选股策略表现出不错的性能。2)机器学习股票收益预测模型选股性能的时效性。本报告对于不同预测窗口长度的机器学习模型,研究选股因子的IC和ICIR随着时间衰减的情况,考察机器学习模型在不同调仓频率下的性能。实证分析表明,机器学习选股因子的IC和ICIR会随时间衰减,在高调仓频率的选股策略中,短线预测模型表现较好,在低调仓频率的选股策略中,长线预测模型表现较好。3)不同预测窗
6、口长度的机器学习模型的结合。不同机器学习选股因子的相关性不高,因此可以将不同模型的选股因子结合起来进行多模型选股,实证表明,多模型集成选股具有更好的表现。二、策略原理与流程2.1特定训练窗口长度的机器学习模型因子选股是通过对股票的收益率进行预测,寻找能够产生超额收益的股票。机器学习通过对股票历史数据的学习,建立股票收益率的预测模型。模型训练时,如果预测股票收益率的时间窗口越小,训练出来的机器学习模型倾向于预测股票的短期走势;如果预测股票收益率的时间窗口较长,则机器学习模型倾向于预测中长线的股票走势。为了避免混淆,本报告将训练机器学习模型时,股票收益率的计算
7、窗口称为“训练窗口”。本报告针对不同的训练窗口长度,构建了三组不同的机器学习预测模型:1)“短线预测模型”:简称模型S,训练窗口为5个交易日(即1周)。在模型训练时,预测目标是未来5个交易日的股票收益率。2)“中线预测模型”:简称模型M,训练窗口为20个交易日(约1个月)。在模型训练时,预测目标是未来20个交易日的股票收益率。3)“长线预测模型”:简称模型L,训练窗口为60个交易日(约1个季度)。在模型训练时,预测目标是未来60个交易日的股票收益率。图1:不同训练窗口的选股模型数据来源:为了建立不同训练窗口长度的选股模型,本报告首先从候选因子池中考察不同因
8、子的IC,根据因子IC筛选出适合该训练窗口长度模型的因子。为了训练
此文档下载收益归作者所有