基于主营构成的指数增强策略.docx

基于主营构成的指数增强策略.docx

ID:55040405

大小:783.50 KB

页数:13页

时间:2020-04-26

基于主营构成的指数增强策略.docx_第1页
基于主营构成的指数增强策略.docx_第2页
基于主营构成的指数增强策略.docx_第3页
基于主营构成的指数增强策略.docx_第4页
基于主营构成的指数增强策略.docx_第5页
资源描述:

《基于主营构成的指数增强策略.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、一、分析框架简介不论基本面还是量化分析方法,对公司收入的研究都是重中之重,因为营收能力是公司未来价值比较直观的反映。为了对收入有更深入的了解,本文运用多因子体系对主营构成进行分析,同时测试主营业务集中度、主营业务相似度因子的选股效果。我们认为主营构成分析有以下几点必要性:1、主营收入的细化能提升公司间对比的准确性;2、因子化主营收入能对主营风格进行持续的跟踪;3、可衍生出收入相关因子,比如本文的主营业务集中度因子,或者主营收入增长因子,也可以通过相关调整增加因子的有效性。图表1:分析框架(按行业)数据获取分类主营收入占比因子化或衍生第1-5名主营构成分词

2、计算分类后的主营业因子化细分收入或衍关键词提取务占比生如HHI因子资料来源:WIND,太平洋证券整理因为每个行业的主营构成差异很大不能直接对比,所以本文的指标均在行业内构建。本篇报告主要围绕主营收入相关指标的构造和分析,主营构成的因子化放入分行业因子系列中讨论。(一)数据获取基础数据:万德主营构成(按行业)。该数据来自上市公司定期报告(年报、中报)附录中公布的主营构成数据,包括项目名称以及项目收入。我们选取排名前5的主营构成。由于公布项目名称经常发生变动,我们进而对项目名称做自然语言的相关处理。(二)自然语言处理因为数据来源于报表附录,所以主营项目并没有

3、较固定的分类,由此会导致不同公司之间或者不同时期对同一项目的描述不一致,也增加了分析的难度。比如房地产公司A的主要收入为房地产,公司B的为房地产业,公司C的为地产,我们认为这几项均应该归为同一类,所以我们要对主营业务做相应处理。主营业务重新归类的方法有两种:1)人工分类,不免带有主观判断的影响。例如,医药、医药制品、医药生产、医药销售是否纳入同一类,还是分为产品、生产、量化策略专题报告P基于主营构成的指数增强报告标题3销售类。可见不同人有不同的分类方法,导致人工分类的可复制性较弱;2)自然语言处理,能从一定程度上减少主观影响,具有可复制性。但也存在分类准

4、确性弱于人工分类的问题。但考虑到可复制性以及编程需要,本文使用第二种方法。处理步骤如下:1)关键词提取:获取词频较高的词语,比如房地产、房地产业、房地产开发里面的关键词“房地产”。关键词的提取分为两步:第一步分词,比如:房地产开发,分词后为房地产/开发。第二步词频统计,也就是统计词语出现的次数。本文使用python第三方的分词库jieba。我们可以使用Jieba.cut(str)对字符串进行分词,也可直接使用extract_tags或者textrank对关键词进行抽取和词频统计。Jieba还支持用户自定义词典(load_userdict函数),用户词库可

5、用于对分词结果进行调整。按照词频排序,我们可以获得出现频度最高的关键词。2)相似度分析:为了将同义词归为同类,我们要分析关键词之间的相似度,并将相似度高的词用词频较高的关键词代替。比如房屋和房地产,我们均归类为房地产。我们使用近义词库包synonyms对词语做相似度处理。通过关键词提取,选择词频最高的词组,词组相似性分析三个步骤最终将大部分主营收入归类于少数的几个大类。通过加总同一大类的收入情况,我们可对该大类收入进行分析和同类公司对比。(三)主营收入占比单个股票在各大类下主营收入占比的计算:例如,房地产收入占比=房地产收入加总/主营收入总额物业管理费收

6、入占比=物业管理费加总/主营收入总额(四)主营收入集中度有了各大类主营收入占比的情况,我们可以衍生出各类细化的主营收入相关因子。比如:主营收入集中度因子。该因子的计算我们借鉴了赫芬达尔赫希曼产业集中度指标(HHI):)2=∑(=1原始HHI里面的X为市场的总规模,为i企业的规模,n为该产业的股票数量,产业集中度越高HHI的值越靠近1。为了描述主营业务的集中度,我们将x替换成主营收入总额,为细分的主营收入。由此主营业务越集中,HHI的值越大,反之主营业务越分散。量化策略专题报告P基于主营构成的指数增强报告标题4(五)相关说明1、主营收入的聚类是行业内

7、部成分股之间的聚类。虽然行业内的成分股的相似程度并不一定很高,但总体上看分行业来进行主营收入聚类比全市场聚类直观上更加符合逻辑。由此,HHI主营业务集中度因子我们先用于行业内部股票的分层和行业内部的增强,然后形成相应指数的增强组合。2、行业内的分析包括:主营业务聚类图,各收入占比,SHHI指标情况、分层效果、市值中性化后的因子收益、行业内因子之间的相关性、以及策略的净值和相关指标。3、因子相关性我们选取了以下常用且市场关注度较高的相关风格因子。图表2:常用风格因子因子名称计算方法因子描述市值总市值=个股当日股价*当日总股本规模相关,信息包含股本和股价换手

8、率成交量/总股数行情相关EPS当期净利润/普通股加权平均业绩相关Roe归属母公司

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。