新闻选股策略回测与展望

新闻选股策略回测与展望

ID:44199632

大小:257.50 KB

页数:9页

时间:2019-10-19

新闻选股策略回测与展望_第1页
新闻选股策略回测与展望_第2页
新闻选股策略回测与展望_第3页
新闻选股策略回测与展望_第4页
新闻选股策略回测与展望_第5页
资源描述:

《新闻选股策略回测与展望》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、新闻选股策略回测与展望21世纪是互联网的时代,互联网对人们生活方方面面的影响已经有目共睹,股票市场也不例外。中国股市是名副其实的“政策市”,也就是说个股和指数的上涨与下跌主要受到国家政策的影响,而个股对应公司的经营状况可能还不如政策有效。什么是政策?政策就是新闻。对于股指,政策是政府对金融市场、宏观经济、利率的调控;对于个股「政策”就是公司新闻或者事件。尽管事件驱动就是研究股票价格随着一些特定上市公司事件的变动,而公司新闻的研究就要比事件驱动更广,比如说事件驱动只是涉及像定向增发、高管增持、收购等,而公司新闻则可能是

2、A公司与B公司合作、遭监管部门调查、高管进军某一领域等等。因此,我们需要实证地检验新闻选股的有效性,也就是个股新闻对股票价格的影响。下面几个部分是按照整个模型搭建的顺序依次阐述,分别为:关键词库的搭建与利好新闻的筛选、关键词的重新筛选、新闻选股策略的回测、加入其他筛选条件的对比、未来可能的改进。详细内容见下文。一、关键词库的搭建与利好新闻的筛选为了检测公司新闻对股票价格的影响,首先需要区分该新闻是利好、利空还是中性的。考虑到融券成本较大、融券标的的局限性,并且为了设计投资策略,我只分析利好新闻对股票价格的正向促进作用

3、。建立词库是一个较大的工程,为了完成这个工程,我采用Python的结巴分词模块'先对3000多个新闻标题进行分词,然后把这些词汇进行初步利好利空的标注。先对结巴分词做一个简单的介绍。结巴分词采用的算法有:•基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG);•采用了动态规划查找最大概率路径,找出基于词频的最大切分组合;•对于未登陆词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法。例如,“我来到北京大学光华管理学院”分词后变成“我I来到I北京大学I光华管理学院”。

4、这样先人工地把新闻标题分词后的词库进行标注。然而像一些金融词汇,比如'‘定增”、“涨停”等词汇还需要进一步的补充。考虑到财经新闻标题的风格比较一致,我只对新浪财经新闻上市公司板块中2年内的新闻标题进行关键词的提取,最终得到一个初始的利好利空关键词库,部分词汇见附录lo建立好关键词后就需要对新闻标题进行利好利空的判断,尽管现在NLP(自然语言处理)领域对语句极性的分析已经较成熟,但是为了提高运算效率,我还是釆用最原始的'‘关键词判定法”一一如果新闻标题中包含正面关键词但不包含负面关键词,则判定为利好新闻。按照这个算法,

5、利好利空关键词筛选出来利好新闻的准确率高达98%。二、关键词的重新筛选人工对关键词极性的判断还是基于一个金融上或者心理上感性的认识,比如我们认为含有“定增”、“合作”、“促进”这些关键词的新闻标题是利好新闻,但是事实是否真是如此还需要实证地检验。而且含有"并购”的新闻就比含有“获得”的新闻更有价值,也就是说不同关键词对股票价格的影响也是不一样的;甚至有的关键词虽然直觉上是利好的,但是实际对股价的刺激是负面的。因此,对每个正面关键词,提取所有包含它的利好新闻,然后按照利好新闻涉及的股票持有1周,统计出“关键词的平均收益

6、率”,表示关键词的有效性。见附录2。按照关键词有效性,剔除掉历史上关键词平均收益率为负的关键词。三、新闻选股策略的回测按照以上筛选利好新闻的方式,对新浪财经上市公司专栏$中过去两年(从2013年1月到2015年1月)的新闻进行回溯测试。回溯测试流程如下:•对每条新闻的新闻标题进行利好利空判断,保留利好新闻•提取该利好新闻对应的股票,方法是如果标题中含有股票简称就直接用该股票,如果标题中不含就在正文中检索•每周一按照开盘价等资金买入上周所有利好新闻对应的股票,剔除开盘涨停的股票,并持有一周,即按照周五收盘价卖出上述操作

7、方式得到的收益率曲线如下:其中红实线表示上述新闻选股策略的收益表现,红虚线表示扣除双边0.5%的交易成本(交易佣金+冲击成本),蓝线代表沪深300指数。可见全股票等资金的新闻选股策略能有效的跑赢指数,不论是否考虑交易费用。四、加入其他筛选条件的对比上述的新闻选股策略只是简单地将上周所有利好新闻的股票等资金地持有,比较nave,可以从股票进一步筛选和资金分配两个角度再优化。股票的筛选条件可以是:ROE、换手率、新闻点击量等;资金分配我只考虑按照新闻发布时间加权。首先考虑ROE。对每周利好新闻的股票进一步用ROE进彳亍筛

8、选,选取ROETTM(trailingtwelvemonths)前100名的股票,若利好新闻的股票不足100只则不筛选,与不筛选股票进行比较。卜mimozoz/owoz一swecmoz8175:030Z/9

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。