因子模型系列之十三:利用LSTM算法估计基金因子暴露度

因子模型系列之十三:利用LSTM算法估计基金因子暴露度

ID:39507107

大小:1.72 MB

页数:20页

时间:2019-07-04

因子模型系列之十三:利用LSTM算法估计基金因子暴露度_第1页
因子模型系列之十三:利用LSTM算法估计基金因子暴露度_第2页
因子模型系列之十三:利用LSTM算法估计基金因子暴露度_第3页
因子模型系列之十三:利用LSTM算法估计基金因子暴露度_第4页
因子模型系列之十三:利用LSTM算法估计基金因子暴露度_第5页
资源描述:

《因子模型系列之十三:利用LSTM算法估计基金因子暴露度》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、正文目录基金的因子暴露和传统方法的局限性4净值数据反推因子暴露构想5LSTM算法介绍6循环神经网络(RNN)6长短期记忆神经网络(LSTM)6标签处理和特征变量选取7标签处理7特征变量选取9模型的训练10数据选取和结果展示13结论16模拟基金方法的失败及思考17模拟基金法介绍17关于模拟基金法失败原因的思考19图表目录图1股票型基金各类定期报告实际平均时滞天数(2018年)4图2股票型基金重仓股市值占基金净资产净值比例均值5图3LSTM网络神经元示意图7图4单只基金经过插值之后的规模类因子暴露度走势示意8图5

2、算法在基金拼接处暴露度跳点敏感度示意9图6过拟合与欠拟合的图形示意11图7K-折交叉验证方法示意图11图8深度学习神经网络结构图12图9模型在训练集与验证集中训练的误差走势图13图10股票型基金测试集中预测结果比较图114图11股票型基金测试集中预测结果比较图214第20页共20页图12股票型基金测试集中预测结果比较图314第20页共20页图13股票型基金测试集中预测结果比较图414图14股票型基金测试集中预测结果比较图514图15股票型基金测试集中预测结果比较图614图16股票型基金测试集中预测结果比较图7

3、15图17股票型基金测试集中预测结果比较图815图18股票型基金测试集中预测结果比较图915图19股票型基金测试集中预测结果比较图1015图20股票型基金测试集中预测结果比较图1115图21模拟基金法产生假基金的流程图17图22模拟基金法产生基金的净值走势图18图23模拟基金法训练集预测结果展示(随机截取)18图24测试集中预测暴露度和真实暴露度对比119图25测试集中预测暴露度和真实暴露度对比219图26测试集中预测暴露度和真实暴露度对比319图27测试集中预测暴露度和真实暴露度对比419第20页共20页基

4、金的因子暴露和传统方法的局限性在进行基金研究的时候,投资者可能会对某只感兴趣的基金到底在哪些因子上有暴露产生好奇。对于目标基金暴露度的观察,计算基金的因子业绩归因,可以给投资者在构建投资组合的时候带来参考;同时对全市场基金因子暴露度迁移的观测,也有助于投资者把握市场的整体情绪。一般情况下,计算基金在某因子上的暴露,需要获悉基金的具体持仓数据。对于投资者自己管理的组合,要获得其具体的动态持仓数据自然不是什么难事。但是对于并非自己管理的目标基金,我们只能通过目标基金的管理人公布的定期报告来获得持仓数据。基金公司每

5、个季度都会公布上季度的季度报告,同时在半年度和年度结束时,会整理发布基金的年度报告。在季度报告中,基金公司会公布报告期末按公允价值占基金资产净值比例大小排序的前十名股票投资明细(即期末前十大重仓股持仓明细),而在半年度报告和年度报告中,则公布期末所有股票的持仓明细。证监会在《证券投资基金信息披露管理办法》中,对于基金管理人定期报告公布时间及公布持仓数据的范围的规定如下:季度报告半年度报告年度报告15个工作日内60日内90日内重仓股持仓数据(前10只)全部持仓数据全部持仓数据表1:公募基金各类型定期报告公布时滞

6、和内容范围资料来源:证监会官网公告、整理我们统计了2018年Wind开放式基金分类下,普通股票型基金2018年实际公布定期报告的之后天数均值,展示如下:图1股票型基金各类定期报告实际平均时滞天数(2018年)资料来源:、Wind资讯第20页共20页从图1中可以看出,基金公司的定期报告存在较大的时滞性,要知道完整的持仓数据至少要等待两个月及以上的时间。同时,定期报告中公布的数据是报告期末静态的快照数据。投资者在进行因子暴露值观测的时候,其实更关心基金持仓和因子暴露值的变动数据,而动态的数据是无法从报告中获取的。

7、季度报告相对及时一些,但季度报告只公布重仓股的持仓明细,于是我们统计了重仓股市值占基金资产净值的比例均值。结果如下:图2股票型基金重仓股市值占基金净资产净值比例均值资料来源:、Wind资讯2018年股票型基金中,排名前十的重仓股比例均值基本维持在43%左右。若直接用重仓股数据代替全部持仓数据来计算基金在因子上的暴露,似乎不够严谨。基于上述这些弊端,我们提出用基金净值数据和因子收益数据来反推基金因子暴露的想法。净值数据反推因子暴露构想由于传统的通过定期报告获取持仓数据,继而计算因子暴露数据的方法存在滞后性强、静

8、态局限的问题,我们决定从基金的净值出发来反向推算基金在各因子上的暴露。我们认为基金的净值走势中,包含了其在因子上的暴露值信息。一般而言,若基金N在因子A上暴露值越多的话,那么基金N的收益会与因子A的收益越像。极端地,若基金N是因子A的纯因子组合,则基金N的净值线与因子A的累积收益曲线完全一致。因此,我们可以通过基金的净值线与因子的收益曲线来反推基金在因子上的暴露。并使用LSTM来完成反推。第20页共

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。