金融数据论文 上市公司论文

金融数据论文 上市公司论文

ID:2188572

大小:34.00 KB

页数:0页

时间:2017-11-15

金融数据论文 上市公司论文_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《金融数据论文 上市公司论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、金融数据论文上市公司论文基于主成分分析和聚类分析的上市公司分类  摘要:本文利用数据挖掘中的主成分分析和聚类分析技术,考察了上市公司的经营业绩,并对其进行归类。具体采取了系统聚类和K-means聚类相结合的聚类方法,综合这两种方法的优缺点,以新疆板块的所有上市公司为样本,进行了实证分析,所得结果可以给各方面人士提供信息决策的依据。上市公司可根据聚类结果了解其自身经营管理的薄弱方面,针对这些有所重点的进行改进;而投资者则可以据此找出最优的公司,为其投资决策提供选择的依据。  关键词:经营业绩;主成分分析;系统聚类;K-means    一、引言    随着我国金融市场的不断发展,

2、上市公司的数量也在逐年增加,2009年我国股票市场正式推出了创业板,为许多高科技的中小公司提供了一个筹融资的平台。在此同时,对于投资者来说,其投资股票的选择余地也变得更加的广泛。但是这么多公司,有的经营业绩好,有的经营业绩差。对投资者来说,如何区分出业绩较好的公司和业绩较差的公司,直接影响到其投资的成功率。因此,通过一定的方法对上市公司进行分类,显得比较重要。  在这一方面,国内很多的学者,在区分上市公司的财务状况时,使用的方法基本上是主成分分析和聚类分析这两种方法相结合。其中比较具有代表性的是,邓秀勤(1999),将聚类分析方法应用到股票市场的板块分析,它选取了每股收益、每股

3、净资产、股东权益率、净资产收益率、净利润率等5个反应盈利能力的财务指标,进行系统聚类分析。但是这种做法,在指标的选择上有些不足,单单从盈利能力指标考虑,不能够很好的反映出上市公司的综合实力。周焯华等(2002),综合考虑行业因素和公司因素,选取了17个指标来考察上市公司的业绩,从而它在指标体系的选择上有一个比较好的改进,但是它在面对如此多的指标的时候,没有进行降维处理,而直接进行了聚类分析,是否所有的指标都发挥了一定的效力值得我们怀疑。陶冶等(2005),应用该方法对中小板的股票进行了投资价值的分析。谢思(2007),利用因子分析和聚类分析相结合的方法对金融类的上市公司进行了经

4、营绩效的分析,这是对以前诸多方法的一个不错的改进。总结国内学者,对上市公司分类所用方法的一个共性,单单使用了系统聚类分析得出聚类结果。  而韩家炜(2006)指出,如果单纯的使用系统聚类这种方法,有个缺陷,系统聚类属于层次法的一种,它一旦一个步骤(合并或分裂)完成,它就不能被撤消。书中指出的另外一种方法,K-means则在类的数目的确定上过于主观性。考虑每种聚类方法各自的局限性和优势,建议在做聚类分析时,将凝聚法和K-means这两种方法结合起来,会达到一个更好的效果。  基于此,本文首先选取比较全面的财务指标,然后利用主成分分析和聚类分析相结合的方法来评价上市公司的业绩,进而

5、对某一区域板块的所有上市公司进行分类。在聚类的过程中,本文首先通过系统聚类的方法确定分类的数目,然后在此类数目的基础上,利用K-means方法进行再聚类。    二、主成分分析和聚类分析    主成分分析的工作对象是高维定量变量形成的数据。在统计学中,主成分分析的主要作用是:在尽量减少原始信息损失的条件下,将高维问题转化为低维问题。其基本原理:统计学认为,变异的数据可以提供某种识辨信息,数据之间的变异越大,能够提供的识辨信息就越多。由于统计学通常采用方差来表示数据之间的变异大小,因此数据的方差越大,数据能够提供的识辨信息量就越大。在高维数据集中,各分量数据所提供的全部识辨信息量

6、可以用各分量的方差之和来表示。一种较好的办法是利用原始数据库建立新的数据库,新数据库能够保持原始数据库的全部识辨信息,并且新数据库所含有的识辨信息能够较多地集中在少数几个分量上,这样我们利用这几个分量就可以在尽量减少原始信息损失的条件,将高维问题转化为低维问题。  聚类是将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异,聚类是一种无指导的学习,不依赖预先定义的类和训练样本。聚类分析主要集中在基于距离的聚类分析。  聚类分析前首先要做的是对数据变量标准化,数据类型大致分为区

7、间标度变量、二元变量、标称型、序数型和比例标度型变量、混合类型变量。而本文中用到的都是区间标度变量,区间标度变量是一个线性标度的连续度量。为了实现度量值的标准化,一种方法是将原来的度量值转换为无单位的值。我们用距离判断样本之间的相似程度,聚类分析算法有划分的方法、层次的方法、基于密度的方法、基于网格的方法、基于模型的方法等,本文选取的方法是划分法中K-means法和层次法中的凝聚法。  划分方法是,给定一个含有n个对象的数据库,一个划分方法构建数据的k个划分,每个划分表示一个聚类,且k≤n。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。