欢迎来到天天文库
浏览记录
ID:11082178
大小:165.50 KB
页数:11页
时间:2018-07-09
《聚类判别分析论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、SAS与现代经济统计分析结课论文姓名:叶文甫学好:089114321班级:统计082基于聚类分析和判别分析方法的股票投资价值分析——关于中小企业版的初步研究摘要:随着市场投资理念逐步转向价值投资,上市公司基本面的变化将更收关注。中小企业板作为新兴的资本市场板块,具有重要的研究意义。利用38家中小企业版上市公司的2004年会计和财务数据,运用聚类分析和判别分析方法对其盈利,成长和扩张能力进行定量分析研究,并据此归结出整个板块股票的分类及其特点,为投资者和市场各参与主体有效把握中小企业上市公司及其成长趋势提
2、供借鉴。关键词:股票;投资价值;聚类分析;判别分析一研究背景:自2004年6月25日深交所推出中小企业版以来,其基本面的变化与市场表现都受到了市场参与各方的极大关注。到目前为止,已有50家公司在深圳中小企业版发行上市,成为中小企业融资的一个重要渠道,也为建立多层次的资本市场提供了广阔的前景。但相对于主板市场的研究,这方面的研究大多停留在定性的研究和对这个股的分析上,缺少对整个中小企业板态势的把握。我利用多元统计分析中的聚类分析对选定的各中小企业版股票进行初步聚类,在此基础上,在应用判别分析对分类情况进行
3、校验且得到一组有用的判别函数,从而达到对中小企业版量化分析的目的,并且得到对市场各方的有指导意义的结论。二、方法(一)聚类分析所谓聚类分析就是根据样品或指标的“相似”特征进行分类的一种多远统计分析方法,这里离的类就是“相似”元素的集合。进行聚类分析需要知道待分类的若干样品及其指标值;然后通过聚类分析将对象的数据特征按一定规则把分类对象分成若干类,通过每一类指标数据的分析,进一步对各个结构进行优化。聚类分析法的基本理想是定义样品之间的距离(或相似系数)和类与类之间的距离。一开始将n个样品各自自成一类,这时
4、类间的距离与样品间的距离是一致的,然后将距离最近的两个类进行合并形成一个新类,并计算新类与其他类之间的距离,再按距离最小准则并类。每并类一次,类的个数就减少。这个过程持续到所有样品都被归为一类为止。传统的聚类算法已经比较成功的解决了低维数据的聚类问题。但是由于实际应用中数据的复杂性,在处理许多问题时,现有的算法经常失效,特别是对于高维数据和大型数据的情况。高维聚类分析已成为聚类分析的一个重要研究方向。同时高维数据聚类也是聚类技术的难点。根据以上聚类分析的基本思想以及各种距离的定义,可以得到不同聚类分析方
5、法,如下:(一)最短距离聚类法 最短距离聚类法,是在原来的m×m距离矩阵的非对角元素中找出,把分类对象Gp和Gq归并为一新类Gr,然后按计算公式计算原来各类与新类之间的距离,这样就得到一个新的(m-1)阶的距离矩阵;再从新的距离矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。(二)最远距离聚类法最远距离聚类法与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。最远距离聚类法所用的是最远距离来衡量样本之间的距离。(三)直接
6、聚类法直接聚类法是先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过m-1次就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。(四)中间聚类法是当类与类之间的距离不采用最短距离也不采用最长距离,而是介于两者之间,这种聚类方法称为中间距离法。当进行到某一步,类Gi和Gj并为G(k),则按
7、中间距离法计算新类G(k)与其他聚类Gl之间的距离。(五)重心法是指类与类之间的距离定义为两类重心之间的距离。(六)离差平方法的基本思想是来自方差分析。先将n个样品各自成一类,然后每次每缩小一类,每缩小一类离差平方和就要增加,选择使离差平方和增加(SSM-SSK-SSL)最小的两类合并,直至所有的样品归为一类为止。(二)判别分析1.基本思想判别分析(DiscriminatoryAnalysis),就是根据已知不同类别的研究对象一批样品观测数据,建立一个判别规则,然后对未知类型的样本进行判别归类的一种统计
8、分析方法.其基本思想是:判别分析就是根据以上观测数据,依据某种判别标准建立一个判别准则(也称为判别函数),并根据该准则对新样品进行判别归类。判别分析的任务是根据已掌握的样本资料,建立判别函数,进而对给定的新观察,判断它来自哪一个总体。2.费歇(Fisher)判别法费歇判别法是Fisher于1936年提出的,它借助于方差分析的思想来导出判别函数和建立判别规则。由于线性函数计算简便,使用起来也方便,所以在Fisher判别中也通常使用线性判别函数
此文档下载收益归作者所有