资源描述:
《上市公司股价异动数据建模诊断》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、上市公司股价异动数据建模诊断摘要:上市公司股价异动为证券市场监管层和投资者所重点关注,因其与证券市场的秩序和投资者的切身利益密切相关。以中国证监会公布的三起违规案例为样本,以股价为响应变量,以市盈率和涨跌幅绝对值为自变量建立回归模型。利用数据建模诊断方法,根据学生化残差、杠杆值、Cook距离、马氏距离等诊断统计量,对股价是否存在异动进行检测,并进行综合交叉印证,确定重点怀疑数据,然后,删除这些可疑数据,再将删除前后表征模型优劣的若干个指标的变化情况进行比对。实证研究表明,三起查处案例中交易异常行为都较好地得到定位,与实际结果相符较好,这对于规范证券市场健康
2、发展及保护投资者合法权益有积极意义。关键词:证券市场;上市公司;股价异动;数据建模诊断中图分类号:F832.5文献标识码:A文章编号:1672-3104(2013)06?0071?08上市公司股价异动是证券市场监管层与投资者都很关心的问题,在这方面已有学者做出了一些探索,如,肖淑芳、李阳[1]运用事件分析法,对重大信息披露与股价异动的相关性进行了研究。史永东、蒋贤峰[2]以Logistic模型为分析工具,建立了违法违规行为的判别模型。ThierryAne,LoredanaUrecheRangau等[3]采用稳健统计方法对亚太股市指数收益中异常点做了检测分析
3、。曾伟[4]运用资产定价回归模型的拟合系数来捕捉股价波动的同步性,研究了上市公司质量与市场波动性的关系。瞿宝忠、徐启帆[5]利用残差系数法来研究重大并购事件首次公告之前股价的异常波动。AureaGrane,HelenaVeiga[6]基于小波变换技术对金融时间序列中的异常点进行了检测研究。本文试图从数据建模诊断的角度,对这个问题进行探讨。我们知道,通过数据建立模型来对经济现象进行分析时,我们对数据本身是做了很多严格的假设条件的,只有这些条件真正满足时,由此得到的模型及其以后基于此所做的推断和结论才是可靠的,否则就值得怀疑。对于数据本身,我们经常假定数据是均
4、匀同质的,即,假定数据集中每一个点对建模的影响是基本相同的,每个点对建模都有影响,但都很微小,单独一个或若干个点不应该对模型的总体变化趋势产生决定性的影响。而实际中,这个条件往往不能得到满足。一个数据集中,经常会有那么一个或几个''不安分”的点,它们经常基于现有建模手段的“漏洞”来“兴风作浪”,它们就是数据集中的异常点,杠杆点及强影响点。本文就是从这个角度,来寻找对建模有“不同寻常”影响的点,从而在数据集中发现这些“异动点”。那么,什么是异常点、杠杆点、强影响点呢?一般来讲,异常点是指那些与既定模型有较大偏离的数据点,杠杆点是指那些远离数据主体的点,强影响
5、点是指对统计推断影响特别大的点。为了能检测出这些点,我们需要了解几个重要的诊断统计量。我们知道,线性回归模型可表示为i=l,2,…,n其中:yi为因变量;xil,…,xi(p?l)为自变量;ei为随机误差;其第i组观察值为(yi,xil,…,xi(p?l))。通常可表示为矩阵形式如下:Y=X0+£(1)其中:Y=(yl,…,yn)T,e=(e1,…,en)T,B=(BO,Bl,…,Bp?l)T,X为nXp阶列满秩矩阵,其第i行为(1,xil,…,xi(p?l)),对于随机误差项£,通常假定其分量e1,…,相互独立,数学期望为零,方差具有齐性,即E(e)=0
6、,var(s)=o21,其中为未知常数,I为n阶单位矩阵,可记为e〜(0,o2I)(2)收稿日期:2013?04?29;修回日期:2013?11?22作者简介:刘天(1974?),男,黑龙江哈尔滨人,东北财经大学金融工程专业博士研究生,主要研究方向:金融工程.在多数情况下还假定£服从标准正态分布,即£〜N(0,o2I)(3)通常的线性回归,大多采用了这些假设。这里有一个值得注意的重要问题,即给定的数据集(yi,xi1,…,xi(p?l)),i=l,2,…,n,是否符合关于模型的假定(1)(2)或(3)式?现考虑回归分析中常用的投影阵,在模型(1)式中,X的
7、投影阵常记为P,并记为Q=I?P,Q为X的正交补空间的投影阵,I为单位阵。由于P作用到Y上可以得到拟合值,因此有些统计学家也称这种特定的投影阵为帽子矩阵(hatmatrix)o在(1)式中,把X的列向量记为1=(1,…,1)T,矩阵X可写成分块形式如下:由于Pl=llT/n,Ql=(I?llT/n),由二次投影公式可知,帽子矩阵P可表示为其中,J=11T,OXc称为矩阵的中心化,它在(i,j)处的元素xcij为(4)现记帽子矩阵的元素为pij,则P=(pij)具有以下性质:(5)帽子矩阵P的对角元素pii在回归诊断中起着十分重要的作用。矩阵就是观测矩阵X去
8、掉已知的第一个向量1而得到。的每一行就是自变量的一组数据,现记i=