多因子模型研究系列之七:使用多因子框架的沪深300指数增强模型

多因子模型研究系列之七:使用多因子框架的沪深300指数增强模型

ID:35623647

大小:540.98 KB

页数:17页

时间:2019-04-03

多因子模型研究系列之七:使用多因子框架的沪深300指数增强模型_第1页
多因子模型研究系列之七:使用多因子框架的沪深300指数增强模型_第2页
多因子模型研究系列之七:使用多因子框架的沪深300指数增强模型_第3页
多因子模型研究系列之七:使用多因子框架的沪深300指数增强模型_第4页
多因子模型研究系列之七:使用多因子框架的沪深300指数增强模型_第5页
资源描述:

《多因子模型研究系列之七:使用多因子框架的沪深300指数增强模型》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、目录1.理论简介42.多因子模型建立流程52.1数据预处理52.2单因子检测72.3收益预测模型102.4风险预测模型143.沪深300指数增强模型建立154.总结与未来研究方向展望17表目录表1:因子定义10表2:最终入选因子15表3:模型分年度收益情况16表4:模型分年度业绩归因16图目录图1:多因子模型建立流程图5图2:数据预处理结果展示7图3:单因子统计检测结果展示(以成交量1月波动率为例)9图4:单因子分层回测结果对比10图5:选股模型相对沪深300净值曲线161.理论简介Barra结构化风险模型是目前全球最知名的多因子模

2、型之一。根据Barra手册的内容,多因子模型被分为两部分,收益模型与风险模型,收益模型的基本表达形式如下:其中::股票i下一期的预期收益率;:股票i在因子j上的因子暴露;:因子j的因子收益率(通过回归模型估计);:股票i的残差收益率;已知股票在每个因子上的因子暴露,通过多因子的收益预测模型,估计各个因子的因子收益率,从而得到股票的预期收益率,这就是多因子收益模型的主要思路。多因子风险模型的基本思路为,通过估计因子的协方差矩阵,刻画股票池未来的波动风险。而后对选股结果以及股票配置仓位进行二次优化:其中为待求解的组合权重,(1)为待优化

3、的目标函数,(2)-(6)需满足的条件限制。1)为收益预测模型给出的组合收益预测,为组合风险预测,其中为风险预测模型给出的个股协方差预测矩阵,为风险厌恶系数,取值越大,组合越偏向于保守风格;1)为组合中股票的因子暴露矩阵,为基准指数的股票权重,该条件限制了组合对于每个因子相对于基准指数的风格偏离范围,防止组合选出的股票风格过于雷同(例如有的收益预测模型给出的组合在市值因子上暴露过高,导致组合大中小盘股配比失衡);2)为组合的行业暴露矩阵,当投资目标为行业中性时需要引入该限制条件,以限制组合相对于基准指数行业配置的偏离范围,使组合的行

4、业配比与基准指数一致;3)第四个条件限制了每只股票权重的上下限,因为A股不允许做空,一般个股权重下限设为0,为防止收益过于集中,有时也会对个股权重设定上限;4)第五个条件限定权重之和为1。1.多因子模型建立流程图1:多因子模型建立流程图多因子模型的建立主要包括四个步骤:数据预处理、单因子检测、收益模型和风险模型。资料来源:2.1数据预处理提取的因子数据需经过数据对齐、去极值、标准化、缺失值处理等步骤,才可进入下一步的选股模型。数据对齐:上市公司财报的报告期和报告发布日期之间有一定延迟,为避免未来信息,在提取数据的时候,需要对日期

5、进行修正,保证因子数据为当时能获取的最新财报数据。去极值:为避免数据中的极端值对回归结果产生过多影响,我们使用“中位数去极值法”,将超过上下限的极端值用上下限值代替。:原始序列:序列的中位数:序列的中位数:去极值处理后的新序列缺失值处理:提取出的因子可能会因为技术原因等情况出现缺失值,在缺失值少于10%的情况下,因子缺失值使用行业中位数代替,当缺失值过多时,考虑更换数据源或使用其他因子。标准化:由于各个因子的单位不同,为了使其具有可比性,需要对其进行ZScore标准化处理,即减去序列均值除以序列标准差,使因子序列近似成为一个符合N(

6、0,1)正态分布的序列。行业市值中性化:将最后得到的因子序列对流动市值与行业哑变量做线性回归,取残差作为新的因子值。图2:数据预处理结果展示资料来源:Wind,2.1单因子检测单因子检测分为统计检验和分层回测两种。在统计检验中,根据Barra手册中关于因子显著性测试的内容,对因子进行横截面回归,同时考虑行业与市值因素的影响::股票i在T+1期的收益率;:第T期,股票i的行业虚拟变量,如股票i在j行业,则取值为1,如不在,则取值为0。这里行业分类选用了申万一级行业分类;:第T期,股票i的流通市值;:第T期,股票i在d因子上的因子暴露;

7、、、:回归模型运算所得的因子收益率;:回归模型运算所得股票i的残差;在每一个横截面上使用上述模型进行加权最小二乘回归(WLS),权重采用流通市值的平方根,一定程度上消除了异方差性。经过回归模型,我们可以得到t检验的t值序列与因子收益序列。下一步,计算因子IC值。信息比率IC(InformationCoefficient)是衡量因子收益预测能力的重要参数,它的计算方法是将每一期的因子值作为因变量,与行业哑变量和市值变量进行回归,取其残差,作为剔除行业与市值影响后的因子值。再计算新因子值与下一期股票收益序列间的Spearman相关系数。

8、最终,回归模型输出以下几个指标:a)t值绝对值平均值:衡量因子整体显著性的指标;b)t值绝对值>2概率:衡量因子显著性是否稳定;c)因子收益平均值:衡量因子收益能力大小的指标;d)因子收益标准差:衡量因子收益能力波动率的指标;e)因子

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。