欢迎来到天天文库
浏览记录
ID:18552492
大小:446.37 KB
页数:8页
时间:2018-09-18
《基于社会媒体的股票行为预测_蒋翠清》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第23卷第1期中国管理科学Vol.23,No.12015年1月ChineseJournalofManagementScienceJan.,2015文章编号:1003-207(2015)01-0017-08DOI:10.16381/j.cnki.issn1003-207x.2015.01.003基于社会媒体的股票行为预测蒋翠清1,2,梁坤1,丁勇1,2,刘士喜1,刘尧1(1.合肥工业大学管理学院,安徽合肥230009;2.过程优化与智能决策教育部重点实验室,安徽合肥230009)摘要:通过社会媒体信息预测股票行为已经成为近年来金融和知识管理等领域的研究热点。考虑到社会媒体参与人员和讨论
2、话题的多样性,传统的基于整体层面分析社会媒体信息来预测股票行为的方法过于粗糙。本文根据社会媒体信息在写作风格和内容特征上的不同,利用文本特征提取技术、主成分分析法、EM聚类技术等分析参与社会媒体的干系人和他们关注的话题。进一步,我们针对每类干系人和话题,从信息活动强度和情感倾向两个方面提取四个社会媒体变量构建股票行为的回归预测模型,用以分析各干系人和话题在社会媒体上的活动状况对公司股票行为的影响。最后,本文以雅虎金融论坛的BankofAmerica板块为实验平台进行实验研究,验证了所提出方法的有效性和实用性。关键词:社会媒体;股票行为;特征提取;情感分析中图分类号:TP391文献标识
3、码:A年2月,哈佛商学院的一位博士研究表明社会媒体1引言的情感表达能提前6到7天预测出股票市场交易量股票行为预测一直是金融等领域的研究热点。的变化。现有的研究主要从整体层面上挖掘社会媒传统的股票行为包括股票回报率、股票交易量和股体的信息,认为分析社会媒体的信息活动强度和情[1]票波动性。早期,研究人员利用公司的财务报表感倾向有利于预测股票行为。然而,开放的社会媒和股票历史信息来预测公司的股票行为。随着互联体使得不同身份的人员均可以在其上自由的发表言网的发展,网络论坛、博客、维基等社会媒体的出现论。不同类型人员的情感倾向对于股票行为的影响[2]为股票行为的分析提供了一个全新的视角。社会
4、是不同的。相同类型人员讨论不同的话题对股票市媒体以Web2.0为核心,为人们分享意见、经验和观[5]场造成的影响也不同。因此,若要更加精确的反点提供了工具和平台,是一种新型的网络信息资源映股票行为的变化,必须进一步分析社会媒体的参[3]组织模式。相对于新闻、报刊和杂志等传统媒体,与人员和热点话题。社会媒体具有互动性,不仅为投资者提供了决策参作为一种重要的社会媒体,公司论坛为广大投考信息,还能使其自由表达观点,并且这些观点将进资者提供了自由开放的信息检索和意见交流平台。一步影响到其他投资人员的投资决策行为。因此,有效的分析参与公司论坛讨论的人员和他们关注的基于社会媒体的股票行为预测已经
5、成为目前金融和知识管理等领域的热点研究问题之一。话题有助于分析公司的股票行为。干系人理论认已有的研究表明社会媒体的信息数量与股票波为,一个公司具有众多利益相关的干系人,包括客[4]户、员工、股东、政府部门人员等。公司要想取得长动性成正比,与股票回报率成反比。社会媒体的[2]情感倾向与股票行为具有显著的统计关系。2012远的发展,不能只关注股东的利益,必须处理好其与[6]各类干系人的关系。由于社会媒体的开放性,不收稿日期:2012-05-29;修订日期:2012-12-14同类型的干系人均可以在公司论坛上自由的发表言基金项目:国家自然科学基金资助项目(71331002);教育部博士[7
6、]学科点专项科研基金资助项目(20120111110027);安论和观点,形成不同的热点话题。相对于从整体徽省软科学重大项目(1302053009);教育部人文社会层面分析公司论坛的信息活动状态,进一步研究每科学研究规划基金资助项目(13YJA630037)类干系人和话题在公司论坛上的信息活动状态能更作者简介:蒋翠清(1965-),男(汉族),安徽人,合肥工业大学教授,博士生导师,研究方向:Web挖掘与商务智能.[8]加精确的预测股票行为的变化。通过本文研究,·18·中国管理科学2015年我们能够知道究竟哪一类人员(或话题)在社会媒体于后续的聚类处理。PCA在最小均方意义下寻找上的活
7、动能对股票行为产生重大影响,从而为公司最能代表原始数据的投影方向,从而达到对特征空决策和政府部门的政策制定提供理论依据。间进行降维。以话题分析为例,说明主成分分析方法的应用。以每个帖子为单位(假设一个帖子主要2社会媒体分析讨论一个话题),根据预定义的文本特征集将其转化2.1干系人分析和话题分析为文本特征向量。表1社会媒体分析的特征集2.1.1文本特征分析技术特征描述一般说来,相同类型的干系人在语言表达上具词汇特征有类似的特征。例如,相对于其他干系人,投资者
此文档下载收益归作者所有