欢迎来到天天文库
浏览记录
ID:50113337
大小:1.39 MB
页数:54页
时间:2020-03-05
《SAS描述统计功能.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2.1描述性统计的基本概念2.1.1统计学的基本概念2.1.2表示数据位置的统计量2.1.3表示数据分散程度的统计量2.1.4表示数据分布形状的统计量2.1.5其它统计量计算中心进行数据分析首先应:明确分析的目的明确分析的对象确定是否需要抽样在一些问题中,要考查整个总体往往是不可能的,因为要耗费太多的时间和资源确定需要记录的数据项目计算中心1.总体和样本总体(population)是所研究的指标测量值的集合。总体样本抽样(sampling)是指从总体中抽取部分的做法。样本(sample)通过抽样得到的总体的一个子集。随
2、机化使样本具有代表性的重要方法2.1.1统计学的基本概念计算中心抽样方法简单随机抽样:在抽样的过程中,任何一个样本被选中的机会都相同。利用计算机产生的随机数(对于有限总体),可模拟简单随机抽样,如对学生的学号用随机数进行抽样对于无限总体不能进行标号,抽样过程不能用随机数,难于实施分层抽样:按数据的层次进行抽样。如小学生的身高,按每年级分为一个层2.1.1统计学的基本概念计算中心随机事件在一次试验中可能发生也可能不发生的事件在试验之前,无人知道发生还是不发生经大量试验,这类事件是有一定规律的2.1.1统计学的基本概念计算
3、中心概率度量随机事件发生的可能性的大小A:随机事件P(A)随机事件发生的概率P(A)=1事件一定发生P(A)=0事件绝对不发生2.1.1统计学的基本概念2.参数与统计量参数(parameter):定量地反映总体的某个性质,如平均值μ、概率π等。统计量(statistics):定量反映样本的某个性质,如样本方差(s2)、样本比例(P)等。2.1.1统计学的基本概念3.数据分析工作的基本步骤研究设计数据查询与收集数据整理数据分析4.描述性统计描述样本的特征2.1.1统计学的基本概念2.1.2表示数据位置的统计量如果要用简单
4、的数字来概括一组观测数据x1,...,xn,可以使用“位置统计量”来作为数据的总体代表,常见的位置统计量有:均值、中位数、分位数、众数等。1.均值(Mean)均值是所有观测值的平均值,是描述数据取值中心位置的一个度量:2.中位数(Median或Med)中位数是描述观测值数据中心位置的统计量,大体上比中位数大(小)的数据为观测值的一半。中位数的一个优点是它不受个别极端数据的影响,具有稳健性。中位数的计算方法是:首先将数据从小到大排序为:x(1),...,x(n),然后计算2.1.2表示数据位置的统计量3.众数(Mode)
5、观测值中出现最多的数称为众数。众数用得不如均值和中位数普遍。在属性变量分析中,常需考虑频数,因此众数用得多些。4.百分位数(Percentile)分位数也是描述数据分布和位置的统计量。0.5分位数就是中位数,0.75分位数和0.25分位数又分别称为上、下四分位数,并分别记为Q3和Q1。2.1.2表示数据位置的统计量2.1.3表示数据分散程度的统计量1.极差(Range)与半极差(Interquartilerange)极差就是数据中的最大值和最小值之间的差:极差=max{xi}–min{xi}上、下四分位数之差Q3–Q1
6、称为四分位极差或半极差,它描述了中间半数观测值的散布情况。2.方差(Variance或Var)方差是由各观测值到均值距离的平方和除以观测量减1:3.标准差(Standarddeviation或StdDev)方差的开方称为标准差:标准差的量纲与原变量一致。4.变异系数(CoefficientofVariation或CV)变异系数是将标准差表示为均值的百分数,是观测数据分散性的一个度量,它在比较用不同单位测量的数据的分散性时是有用的:2.1.3表示数据分散程度的统计量2.1.4表示数据分布形状的统计量偏度和峰度是描述数据分
7、布形状的指标。1.偏度(skewness)偏度是刻画数据对称性的指标。偏度的计算公式为:在SAS中:关于均值对称的数据其偏度为0;左侧更为分散的数据,其偏度为负,称为左偏;右侧更为分散的数据,其偏度为正,称为右偏。2.峰度(kurtosis)峰度描述数据向分布尾端散布的趋势。峰度的计算公式为:利用峰度研究数据分布的形状是以正态分布为标准(假定正态分布的方差与所研究分布的方差相等)比较两端极端数据的分布情况,若近似于标准正态分布,则峰度接近于零;尾部较正态分布更分散,则峰度为正,称为轻尾;尾部较正态分布更集中,则峰度为负
8、,称为厚尾。2.1.4表示数据分布形状的统计量2.1.5其它统计量1.均值的标准误(StdErrorMean或StdMean或Stderror)2.校正平方和(Correctedsumofsquares)3.未校正平方和(Uncorrectedsumofsquares)4.k阶原点矩其中A1即为均值。5.k阶中心矩2.1.5其它统
此文档下载收益归作者所有