数量分析方法习题[重点]

数量分析方法习题[重点]

ID:44509112

大小:125.82 KB

页数:8页

时间:2019-10-22

数量分析方法习题[重点]_第1页
数量分析方法习题[重点]_第2页
数量分析方法习题[重点]_第3页
数量分析方法习题[重点]_第4页
数量分析方法习题[重点]_第5页
资源描述:

《数量分析方法习题[重点]》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、一简答题1、简述聚类分析的思想聚类分析:是一种将样本数据按一定科学方法分为若干类的统计方法。聚类使得在同一•类的事物具有高度的同质性,不同类事物貝有高度的界质性。聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重耍的人类行为。聚类分析的冃标就是在相似的棊础上收集数据来分类。聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,他们讨论的对象是大虽的样品,要求能合理地按各自的特性来进行合理的分类基木思想是根据事物木身的特性研究个体分类的方法;聚类原则是同一类中的个体冇较大

2、的相似性,不同类中的个体差异很大。2、简述判别分析的基本思想定义:判别分析乂称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。其基木原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的人量资料确定判别函数中的待定系数,并计算判别指标C据此即可确定某一样本属于何类。当得到一个新的样品数据,要确定该样品属于已知类型屮哪一类,这类问题属于判别分析问题。判别分析的基本思想判别分析是用于判断个体所属类别的一种统计方法。根据己知观测对象的分类和若干表明观测对象特征的变量值,

3、建立判别函数和判别准则,并使其错判率最小,对于一个未知分类的样本,将所测指标代入判别方程,从而判断它來H哪个总体。当然,这种准则在某种意义上是最优的,如错判概率最小或错判损失最小等。其前提是总体均值有显著差界,否则错分率大,判别分析无意义。3、简述主成分分析的基本思想主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。在社会经济的研究中,为了全面系统的分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,具冇一定的相关性。主成分分析试图在力保数据信息丢失最

4、少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变聚空间进行降维处理。很显然,识辨系统在一个低维空间要比在一个高维空间容易得多。在力求数据信息丢失最少的原则下,对高维的变最空间降维,即研究指标体系的少数几个线性组合,并口这儿个线性组合所构成的综合指标将尽可能多地保留原來指标变界方血的信息。这些综合指标就称为主成分。要讨论的问题是:(1)基于和关系数矩阵还是基于协方差矩阵做主成分分析。当分析屮所选择的经济变量具冇不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。(2)选择儿个主成分。主成分分

5、析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。(3)如何解释主成分所包含的经济意义。基木思想主成分分析是设法将原來众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标來代替原来的指标。主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数儿个主成分来揭示多个变屋间的内部结构,即从原始变量屮导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不和关.通常数学上的处理就是将原來P个指标作线性组合,作为新的综合指标。

6、最经典的做法就是用F1(选取的笫一个线性组合,即第一个综合指标)的方差來表达,即Var(Fl)越人,表示F1包含的信息越多。因此在所有的线性组合屮选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(Fl,F2)=0,则称F2为第二主成分,依此类推对以构造出第三、第四,……,第P个主成分。4、简述众数、中位数及平均数的优缺点众数:不受极端值影响;具有不唯一性;数据分

7、布偏斜程度较人且有明显峰值时应用中位数:不受极端值影响;数据分布偏斜程度较大时应用平均数:易受极端值彩响;数学性质优良:数据对称分布或接近对称分布时应用平均数:反映了一组数据的平均大小,常用來代表数据的总体“平均水平〃。中位数:像一条分界线,将数据分成询半部分和后半部分,因此用來代表一•组数据的"中等水平〃。众数:反映了出现次数最多的数据,用来代表一组数据的"多数水平〃。这三个统计量虽反映有所不同,但都可表示数据的集中趋势,都可作为数据一般水平的代表。平均数:与每一个数据都有关,其屮任何数据的变动都会相应引起平均数的变动。主要缺

8、点是易受极端值的影响,这里的极端值是指偏大或偏小数,当出现偏大数时,平均数将会被抬高,当出现偏小数时,平均数会降低。中位数:与数据的排列位置有关,某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不受数据极端值的影响。众数:与数据出现的次数冇关,着眼于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。