欢迎来到天天文库
浏览记录
ID:55993298
大小:115.50 KB
页数:7页
时间:2020-03-15
《数量分析方法习题.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、一简答题1、简述聚类分析的思想聚类分析:是一种将样本数据按一定科学方法分为若干类的统计方法。聚类使得在同一类的事物具有高度的同质性,不同类事物具有高度的异质性。聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,他们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类基本思想是根据事物本身的特性研究个体分类的方法;聚类原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。2、
2、简述判别分析的基本思想定义:判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。 其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。 当得到一个新的样品数据,要确定该样品属于已知类型中哪一类,这类问题属于判别分析问题。判别分析的基本思想 判别分析是用于判断个体所属类别的一种统计方法。根据已知观测对象的分类和若干表明观测对象特征的变量值,建立判别函数和判别准则,并使其错判率最小,对于一个未知分类的样
3、本,将所测指标代入判别方程,从而判断它来自哪个总体。当然,这种准则在某种意义上是最优的,如错判概率最小或错判损失最小等。其前提是总体均值有显著差异,否则错分率大,判别分析无意义。 3、简述主成分分析的基本思想主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。在社会经济的研究中,为了全面系统的分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性。主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。很
4、显然,识辨系统在一个低维空间要比在一个高维空间容易得多。在力求数据信息丢失最少的原则下,对高维的变量空间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就称为主成分。要讨论的问题是:(1)基于相关系数矩阵还是基于协方差矩阵做主成分分析。当分析中所选择的经济变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。(2)选择几个主成分。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。(3)如何解
5、释主成分所包含的经济意义。基本思想主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差
6、最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。4、简述众数、中位数及平均数的优缺点众数:不受极端值影响;具有不唯一性;数据分布偏斜程度较大且有明显峰值时应用中位数:不受极端值影响;数据分布偏斜程度较大时应用平均数:易受极端值影响;数学性质优良;数据对称分布或接近对称分布时应用平均数:反映了一组数据的平均大小,常用来代表数据的
7、总体“平均水平”。中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”。众数:反映了出现次数最多的数据,用来代表一组数据的“多数水平”。这三个统计量虽反映有所不同,但都可表示数据的集中趋势,都可作为数据一般水平的代表。平均数:与每一个数据都有关,其中任何数据的变动都会相应引起平均数的变动。主要缺点是易受极端值的影响,这里的极端值是指偏大或偏小数,当出现偏大数时,平均数将会被抬高,当出现偏小数时,平均数会降低。中位数:与数据的排列位置有关,某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不受数据极端值的影响。众数:与数据
8、出现的次数
此文档下载收益归作者所有