资源描述:
《多因子选股基于中证1000的多频共振选股策略》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
一、初探证1000量化选(一)多因子选模型设计多因子选是当前量化选的主流方法,其灵感来自于套利定价理论。从原理上讲,多因子模型假设权益收益率能够由一揽子因子进行解释,即?=??+?式?是权益收益率,?是因子暴露矩阵,?是因子收益率,?是特异性收益。多因子模型的一般形式(即上式)仅具有理论上的意义。对实际投资而言,一个投资者必须知道具体的因子是什么,且这种因子要能够有效量化,才能进一步通过模型得到权益预收益率的合理估计。因此,在现实多因子选的目的是找到解释能力足够强的模型,以及因子收益率足够稳定的因子,并预测未来权益的预收益。这其,大量的工作将聚焦于因子的挖掘与选择。近来,随着计算机技术的发展,一些算法被广泛用于挖掘人工因子,以及对因子暴露和预收益率之间的关系进行更复杂的建模,这些方法在许多场合大放异彩,但也受到过拟合和据本身带来的大量质疑。本文是多因子选系列的第一篇,将主要集在运用传统的回归方法上,选过程大致分为以下几个步骤:计算因子暴露和权益收益率线性回归计算预收益率根据预收益率进行截面配置图表1:多因子选的标准操作程序资料来源:研究所证是权重分散的,成分具有小市值和高换手的特点,同时最近个之间分化呈加剧趋,从结构上看非常适合作为多因子选测试的标的池。另外,基于证的和权已于近上市,证及其成份也预迎来更多、更广泛的市场关注。本文选范围设置为证1000成分。(二)因子库在《行业轮动专题系列》,个因子组成的纯量价因子库和因子组合能够有效识别截面优行业;在个上,这些因子或许同样能够起到解释和预测作用。对于个而言,更多的风格因子能够被直接定义,例如规模和换手率等因子。因此,本段首先扩充了《行业轮动专题系列》的因子组合,加入了部分在行业上不方便定义,但是在个层面意义明显的因子。另外,本段也引入了一个全新的因子,pER(proxyExpectedReturn,预收益代
1理),作为经典风格因子库和《行业轮动专题系列》自研因子库的一个补充。在实证下,本文也发现该因子通过与某些因子组合,能够在样本内回测获得较高的超额收益,可以作为一个提供额外息的有效因子。图表2:重分类后的选因子库风格/大类因子因子定义历史Beta最近一权益收益率对市场收益率时间序列回归的回归系贝塔动量波动率非对称Beta上行Beta减去下行Beta相对强度最近一权益的对超额收益率加权求和后的平滑值历史Alpha在计算贝塔的时间序列回归,截距项平滑值历史残差波动率在计算贝塔的时间序列回归,回归残差的波动率周收益率标准差最近一周收益率的波动率累积收益率范围最近一累积对收益率的最大值减去最小值规模市值规模流通市值的对流动性换手率对最近一的票换手率求和,然后取对偏度最近一周收益率的偏度分布特征风险动量加速度交易/情绪峰度最近一周收益率的峰度协偏度最近一周收益率三阶协矩的望值在险价值最近一周收益率的在险价值望损失最近一周收益率的望损失相对强度加速度相对强度对时间的一阶导历史Alpha加速度历史Alpha对时间的一阶导彩票需求过去一个季度内所有交易周最高个单周收益率的均值预收益代理(pER)新回报率对标准化价格序列回归拟合度的逻辑变换资料来源:研究所因子库的所有因子共分为大类个细分因子,完全采用个标准化的量价据进行计算,不涉及财务或其他基本面据。这些因子分别从不同角度对个收益率特征进行了描述:贝塔、动量、波动、规模、流动性:这几类因子均为常见的风格因子,已有研究表明,风格因子在一定程度上能够有效解释权益收益率;非对称Beta是传统Beta的一个扩展,在《行业轮动专题系列》有过详细介绍,主要用于衡量标的在不用市场状态下对基准的相对跟随程度差别;分布特征、风险、动量加速度:这几类因子也在《行业轮动专题系列》得到过有效验证,可以认为是经典风格因子体系的一个额外补充;交易/情绪:彩票需求因子同样在《行业轮动专题系列》做过介绍,主要度量了市场参与者在交易时的彩票心理;预收益代理(pER)则是一个全新的因子;
2预收益代理(pER)由Burlacuetal.()提出,其度量了标准化价格对权益收益率的解释程度。理论上,市场息分为公共息和私人息,公共息被认为已经完全实现在价格上,私人息则没有。对于私人息不准确或噪音较大的情况,均衡价格只片面反映了私人息,投资者对该票需求会较低,价一般也会相对较低,投资者会更多的从当日价格上收集息,判断未来是否加仓。这时,折价反映了风险补偿,预收益也会更高。投资者的私人息准确度以及不确定性利用收益率对票价格时序回归的R方可以度量私人息的噪音程度。当私人息不准确时,投资者更多的从市场收集息(今日价),价与收益率呈现较强的负相关性,回归R方较高;反之则较低。具体而言,pER因子的计算分为以下几个步骤:对所有个的价格进行净值化处理,得到??????对个所属的宽基(证)进行净值化处理,得到???????计算个的标准化价格,???????????使用滞后的个标准化价格对收益率进行时序回归,得到拟合优度?2?2)对R方进行逻辑变换,得到预收益代理,???=ln(1−?2原文,pER因子的计算还包含一些行业组合的回归处理。本文暂未引入行业变量,故这里暂时忽略这一步。(三)基于证1000的选策略使用经典的回归法,借鉴《行业轮动专题系列》的成熟方案,本段依据前一小节的个因子对基于成分的选策略进行了初步测试。本段同样引入批量测试方案,对因子组合的子集依次回测,并基于化收益率、化夏普比率和化卡玛比率三个维度选出较优策略(因子组合)进行合成。本段测试的所有策略均为周度调仓。对于停牌的票,本文进行了剔除处理。与行业轮动策略不同,个策略可以直接落地进行交易,故本文也考虑交易成本,设置为双边0.3%。另外,值得注意的是,如果进一步考虑到公募产的要求,单只个的权重不得超过总权重的10%。本段同时测试了不考虑仓位限制和考虑仓位限制两种情况下,基于证的量化选策略的表现。考虑仓位限制条件下,对于模型给出权重高于%的个,权重设为%。理论上,额外的限制会破坏模型原有的预测结构,可能导致模型表现变差和策略收益降低,后面的实际回测也印证了这一观点。
3图表3:净值曲线:考虑仓位限制/不考虑仓位限制策略:无仓位限制策略:有仓位限制证100043210资料来源:同花顺研究所图表4:因子相对权重16%14%12%10%8%6%4%2%0%资料来源:同花顺研究所
4图表5:业绩标:考虑交易成本,不考虑仓位限制业绩标最近一最近三2016以来证1000(2016以来)化收益率.%.%.%.%化波动率.%.%.%.%化夏普比率(3%无风险收益下)....最大回撤.%.%.%.%卡玛比率....平均周换手率%%%平均持有个量资料来源:同花顺研究所图表6:度收益率对比:考虑交易成本,不考虑仓位限制证1000选策略2022202120202019201820172016-50%-40%-30%-20%-10%0%10%20%30%40%50%资料来源:同花顺研究所基于证的量化选策略初步回测结果表明,因子组合在证下能够有效选出优个,总体而言大幅优于同业绩基准,以来均超额%左右,每均跑赢业绩基准,除以外均获得正收益,月相对胜率也达%左右,同时最近三化收益较高,能够适应当下的市场环境。但是,从另一个角度看,即便是进行了不同维度的挑选与合成,策略的分散化程度仍然不足够,在设置权重上限以后各项业绩标有明显下降。此外,策略的收益方面或仍有提升空间。
5图表7:业绩标对比:考虑仓位限制VS不考虑仓位限制业绩标:2016以来考虑仓位限制:单只个上限10%不考虑仓位限制:单只个上限100%化收益率.%.%化波动率.%.%化夏普比率(3%无风险收益下)..最大回撤.%.%卡玛比率..平均周换手率%%相对胜率%%绝对胜率%%月相对胜率%%月绝对胜率%%资料来源:同花顺研究所二、选策略进阶:参再测试(一)单一频率参组合下选策略的实际落地问题本文在前一章节初步测试了基于证的多因子选策略的效果,同时,一些实际落地情况下的问题也暴露出来,其最大的问题有二:策略的化收益率能否再提升单只个的权重上限使策略表现下降个权重上限的问题一般可以通过进一步引入优化器解决。然后,优化器在某些角度仍是对原有模型预测结构的破坏,粗暴的使用优化器,效果也不一定能优于粗暴的设置权重上限为%。能否尽量不使用优化器,或者说,能否在使用优化器之前,尽量让策略受限制的影响比较低,也即不让优化器过度的干预组合权重,而只是对组合进行小幅微调?答案是:可以。如果对参进行调整,更多维度的因子组合或许能够带来更高化收益的策略。前文,之所以部分个的权重在已经进行策略组合的情况下仍超过%,是因为同一参体系下,对于个状态的识别具有相似性。截面上选出的组合,如果都是表现较好的组合,它们也会是比较相似的,通过策略分散并不能充分分散个别权重。在不同参体系下,因子组合相似程度减弱,表现较好的组合可能会存在更多的差异,这种差异性能够进一步降低个别权重的集。因此,后文的展开也分为两个部分:对不同频率参下的因子组合进行测试;
6对不同频率下的多因子选策略进行组合,得到“多频共振”的选策略;本章将首先展开第一个部分。(二)频参下的选策略本段首先测试了频参下的选策略,即一计算调整为半。需要注意的是,并非所有因子都适合或有必要进行参调整,例如:部分因子本身的计算方式导致调整前后因子差别很小,可以不调,如两个动量加速度因子;部分因子进行调整后样本减少,会导致回归估计准确的程度下降,不太适合调整,故本文暂时不调,如非对称Beta因子;部分因子在原文被认为不太适合进行调整,即参调低以后可能导致因子失效,如彩票需求和预收益代理因子。这里本文秉持性态度,暂不进行调整,但本系列在后续报告可能会测试调整后的方案;因此,最后的因子参调整主要集在经典风格因子以及分布特征、风险因子上,这样的因子组合总体上能够更好的反映个在频(半)下的特点。基于调整后的因子,本段按照前文的方式进行回测。图表8:参调整后的选因子库:频风格/大类因子因子定义历史Beta调整最近半权益收益率对市场收益率时间序列回归的回归系贝塔非对称Beta上行Beta减去下行Beta动量相对强度调整历史Alpha调整最近半权益的对超额收益率加权求和后的平滑值在计算贝塔的时间序列回归,截距项平滑值历史残差波动率调整在计算贝塔的时间序列回归,回归残差的波动率波动率周收益率标准差调整最近半周收益率的波动率累积收益率范围调整最近半累积对收益率的最大值减去最小值规模市值规模流通市值的对流动性换手率调整对最近半的票换手率求和,然后取对分布特征风险动量加速度偏度调整最近半周收益率的偏度峰度调整最近半周收益率的峰度协偏度最近一周收益率三阶协矩的望值在险价值调整最近半周收益率的在险价值望损失调整最近半周收益率的望损失相对强度加速度相对强度对时间的一阶导历史Alpha加速度历史Alpha对时间的一阶导
7交易/情绪彩票需求过去一个季度内所有交易周最高个单周收益率的均值预收益代理(pER)回报率对标准化价格序列回归拟合度的逻辑变换资料来源:研究所图表9:净值曲线:频参,考虑仓位限制/不考虑仓位限制策略:无仓位限制策略:有仓位限制证100043210资料来源:同花顺研究所图表10:因子相对权重:频参16%14%12%10%8%6%4%2%0%资料来源:同花顺研究所
8图表11:业绩标:频参,考虑交易成本,不考虑仓位限制业绩标最近一最近三2016以来证1000(2016以来)化收益率.%.%.%.%化波动率.%.%.%.%化夏普比率(3%无风险收益下)....最大回撤.%.%.%.%卡玛比率....平均周换手率%%%平均持有个量资料来源:同花顺研究所图表12:度收益率对比:频参,考虑交易成本,不考虑仓位限制证1000选策略:频2022202120202019201820172016-0.6-0.4-0.200.20.40.6资料来源:同花顺研究所基于频参对证选策略进行回测,不考虑仓位限制,较优组合下策略的化收益率明显提升。但是,考虑%的持仓上限以后,策略的化收益下降更为明显,下降后的净值甚至不如低频参下的组合。说明频参下选更集,在短上模型识别的个差异比长更剧烈,策略更容易重仓某些个。另外,可能是由于号更偏短,策略的换手率也略高于低频参组合。频策略单独作为一个策略仍面临实际落地问题,尤其是对于公募产而言。但是,这样的策略提供了额外的较优选组合,可以作为后续策略合成的标的。
9图表13:业绩标对比:频参,考虑仓位限制VS不考虑仓位限制业绩标:2016以来考虑仓位限制:单只个上限10%不考虑仓位限制:单只个上限100%化收益率.%.%化波动率.%.%化夏普比率(3%无风险收益下)..最大回撤.%.%卡玛比率..平均周换手率%%相对胜率%%绝对胜率%%月相对胜率%%月绝对胜率%%资料来源:同花顺研究所(三)高频参下的选策略采取同样的方式,本段测试了高频参下的选策略。对参进行高频调整,在频参基础上,将一计算调整为一个季度。图表14:参调整后的选因子库:高频风格/大类因子因子定义历史Beta调整最近一个季度权益收益率对市场收益率时间序列回归的回归系贝塔非对称Beta上行Beta减去下行Beta相对强度调整最近一个季度权益的对超额收益率加权求和后的平滑值历史Alpha调整在计算贝塔的时间序列回归,截距项平滑值历史残差波动率调整在计算贝塔的时间序列回归,回归残差的波动率波动率周收益率标准差调整累积收益率范围调整最近一个季度周收益率的波动率最近一个季度累积对收益率的最大值减去最小值规模市值规模流通市值的对流动性换手率调整对最近一个季度的票换手率求和,然后取对动量分布特征风险动量加速度偏度调整最近一个季度周收益率的偏度峰度调整最近一个季度周收益率的峰度协偏度最近一周收益率三阶协矩的望值在险价值调整最近一个季度周收益率的在险价值望损失调整最近一个季度周收益率的望损失相对强度加速度相对强度对时间的一阶导历史Alpha加速度历史Alpha对时间的一阶导
10交易/情绪彩票需求过去一个季度内所有交易周最高个单周收益率的均值预收益代理(pER)回报率对标准化价格序列回归拟合度的逻辑变换资料来源:研究所图表15:净值曲线:高频参,考虑仓位限制/不考虑仓位限制策略:无仓位限制策略:有仓位限制证1000543210资料来源:同花顺研究所图表16:因子相对权重:高频参14%12%10%8%6%4%2%0%资料来源:同花顺研究所
11图表17:业绩标:高频参,考虑交易成本,不考虑仓位限制业绩标最近一最近三2016以来证1000(2016以来)化收益率.%.%.%.%化波动率.%.%.%.%化夏普比率(3%无风险收益下)....最大回撤.%.%.%.%卡玛比率....平均周换手率%%%平均持有个量资料来源:同花顺研究所图表18:度收益率对比:高频参,考虑交易成本,不考虑仓位限制证1000选策略:高频2022202120202019201820172016-60%-40%-20%0%20%40%60%80%资料来源:同花顺研究所高频参下,选策略对比频的表现变化和频参对比低频的变化非常类似:不考虑仓位限制下化收益更高,考虑后收益下降明显,同时换手偏高。由此,可以粗略的认为各个参下因子均能反映个在一定频率的特征,选出的组合也各有特色,但都面临增加持仓上限要求以后收益的收缩,且这种收缩的程度随着参的调降而增加。高频参组合单独作为策略仍不适合,因此,这样的组合提供的依然是一个合成标的,本文将在后面的章节讨论合成策略,即“多频共振”的优。
12图表19:业绩标对比:高频参,考虑仓位限制VS不考虑仓位限制业绩标:2016以来考虑仓位限制:单只个上限10%不考虑仓位限制:单只个上限100%化收益率.%.%化波动率.%.%化夏普比率(3%无风险收益下)..最大回撤.%.%卡玛比率..平均周换手率%%相对胜率%%绝对胜率%%月相对胜率%%月绝对胜率%%资料来源:同花顺研究所三、执行多频共振的选策略前文提到,各个频率下的策略单独作为一个策略无法解决个持仓上限的问题。对此,本章推出“多频共振”的方案。这里将基于种频率参的选策略进行等权合成,即每种频率下的策略各占/仓位,暂不进行频率择时。基于证的“多频共振”合成策略在回测内表现优秀。图表20:净值曲线:多频共振,考虑仓位限制/不考虑仓位限制策略:无仓位限制策略:有仓位限制证100043210资料来源:同花顺研究所
13图表21:业绩标:多频共振,考虑交易成本,不考虑仓位限制业绩标最近一最近三2016以来证1000(2016以来)化收益率.%.%.%.%化波动率.%.%.%.%化夏普比率(3%无风险收益下)....最大回撤.%.%.%.%卡玛比率....平均周换手率%%%平均持有个量资料来源:同花顺研究所图表22:度收益率对比:多频共振,考虑交易成本,不考虑仓位限制2022202120202019201820172016证1000选策略:多频共振-60%-40%-20%0%20%40%60%80%资料来源:同花顺研究所合成以后,考虑仓位限制的组合要优于之前的任何一个组合,这是因为各个不同频率的参组合之下,其选组合本身存在差异。通过等权合成,策略在截面上持仓变得更为分散,持有个的量更多,单只个权重超过%的情况也更少,或者说,超过%的幅度会更低。如此一来,考虑仓位限制以后,策略化收益率下降的不会特别明显,总体上表现非常不错,更适合实际落地。“多频共振”策略最近三取得.%的化收益,每都能战胜基准,除以外均取得正收益,月相对胜率也达%,平均周换手率也处于更低水平。
14图表23:业绩标对比:多频共振,考虑仓位限制VS不考虑仓位限制业绩标:2016以来考虑仓位限制:单只个上限10%不考虑仓位限制:单只个上限100%化收益率.%.%化波动率.%.%化夏普比率(3%无风险收益下)..最大回撤.%.%卡玛比率..平均周换手率%%相对胜率%%绝对胜率%%月相对胜率%%月绝对胜率%%资料来源:同花顺研究所四、总结、风险提示和后续改进(一)多频共振算法与策略回顾本文采用“多频共振”算法,对不同参频率下的较优策略进行等权合成,所得组合策略能够长战胜业绩基准,在回测内表现优异。图表24:全策略回顾业绩标:2016以来低频参频参高频参多频共振证1000考虑个持仓限制是否是否是否是否化收益率.%.%.%.%.%.%.%.%.%化波动率.%.%.%.%.%.%.%.%.%化夏普比率%无风险收益下.........最大回撤.%.%.%.%.%.%.%.%.%卡玛比率.........平均周换手率%%%%%%%%平均持有个量相对胜率%%%%%%%%绝对胜率%%%%%%%%月相对胜率%%%%%%%%月绝对胜率%%%%%%%%是:%|否:%资料来源:同花顺研究所
15多频共振的“多频”的是因子参的多频。同一频率参下,因子组合相似度较高,选出的优票组合也比较相似,这使得策略在某些时间段持仓集度较高,实际落地存在较大困难,无法满足公募产关于单只个持仓上限的要求,而粗暴限制持仓权重又会大幅拖累组合净值。通过多频共振的方式,不同频率参下的因子,其选出的组合往往差异更加明显,有利于截面上策略持仓的分散,施加权重限制以后对组合的影响更小,能够更充分的保留各子策略自身的优。(二)风险提示尽管基于证的“多频共振”选策略在回测内表现优异,一些风险点仍然值得特别留意:停牌和涨跌停机制可能导致个收益率失真:例如,如果没有涨停限制,某个可能会涨的更多,但是因为报价不被接受,该个最终涨跌幅为涨停板幅,这可能导致实际上对当日收益率的低估。停牌后的复牌同样会影响个收益率的真实性,导致某些因子计算失真。从这个角度讲,使用进行测试也有一定优。回测长度有限:这一点与本系列之前的其他报告类似。证于月才启用,加上因子的计算,实际能够留给组合回测的时间比较短。最后的净值据从开始,到月止,总共只有半的时间,与内和外的一些成熟研究相比回测时间较短。本文的策略表现较好也可能是受到时间区间影响的结果,在更长的时间段内能否仍然表现较好需额外审慎评估。个的流动性问题:证部分个规模较小,如果模型在某段时间对过于小市值的个给予较高权重,对于一些规模较大的产,可能会受到实际落地交易成本上升的影响。(三)后续改进为解决上述问题,有以下方案可以作为后续改进的参考:扩大选样本,考虑进一步测试和证下的选策略。与证相比,和证的启用时间更长,个规模也更大。探索更多有效选因子,更好的分散组合,避免个别权重过于集。