正文描述:《应用统计学总复习》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、应用统计学总复习教师:严洁2012年6月[本课件专为北大政府管理学院《应用统计学》课程所设计,限于选修本课程的学生使用,未经作者允许请勿以任何方式传播。]第一部分:重要概念、知识点一、应用统计学全景1.1描述统计:是指用归纳性的数值对一个已知的样本或者总体的数量特征进行概括1.2推断统计:是从样本信息推论到总体数量特征的统计技术1.3.测量尺度1.3.1定类尺度:每一种不同的数字或符号代表着不同的类别或标记的一种度量方法。是测量定类变量所使用的尺度。1.3.2定序尺度:每一种数字或符号代表着有序的选项,但各选项之间不必是等距
2、关系的一种度量方法。1.3.3定距尺度:是指有一个固定的数字区间贯穿于一个度量序列之中的度量方法。每个数字之间是等距的,并且0只代表等距序列中的一个位置,而不是代表“一无所有”。1.3.4定比尺度:是指数字的赋值能够具有所有算术特征的一种度量方法。0就代表“一无所有”。二、描述统计2.1平均值mean:用于定距及以上变量的集中趋势的描述。2.2众数mode:出现次数最多的值,用于任一层次的变量集中趋势的描述。2.3中位值median:数据序列中处于中央位置的值,用于定序及以上变量的集中趋势的描述。第1页共14页2.4方差va
3、riance、标准差std.deviation:观察值与其平均值之差的平方和除以全部观察总数。方差的平方根就是标准差。标准差越大,平均值的代表性越小。它表示数据的离散程度。2.5集中趋势:均值、中位数、众数;离散趋势:方差、标准差、四分位差、极差。2.6列联表:通过将两个变量交互分类,旨在发现变量之间是否存在某种联系的频次/频率分布表。适用于定类、定序变量。2.6.1列联表的卡方检验:检验变量之间是否独立。在sig<0.05的情况下,说明变量之间不独立。2.6.2列联强度系数:表示变量之间关系的强弱。在sig<0.05的情况
4、下,绝对值越接近于1,说明变量之间关系越强。2.6.3定类变量:ф系数、C系数、V系数、λ系数(lambda)、τ系数(Goodman&KruksalTau-y)2.6.4定序变量:斯皮尔曼等级相关系数ρ、Gamma系数、Kendall’sTau系数、d系数三、推断统计3.1概率分布:回答的是随机现象一共有多少种结果以及每种结果所伴随的概率是多少。3.2抽样分布:是样本统计量的概率分布。对一个固定的总体,在确定的样.....本设计和样本量的条件下,样本统计量的所有可能取值及其出现概率的序列就是该统计量的抽样分布。3.3正态分
5、布:3.3.1正态分布的两个参数——均值和标准差一旦确定,正态分布的具体形态也就唯一确定。3.3.23σ法则:在正态分布中,有68.3%的变量值落在以平均数为中心的一个标准差范围内;有95.4%的变量值落在以平均数为中心的两个标准差范围内;有99.7%的变量值落在平均数为中心的三个标准差范围内。第2页共14页3.4标准正态分布:标准差为1,均值为0的正态分布N(0,1)称为标准正态X−μ分布。z=σ3.5中心极限定理:从任意一个总体中随机抽出规模为n的样本,随着n的扩大(n>=30),样本均值的抽样分布会近似服从正态分布。3
6、.6统计推论分为两类:参数估计和假设检验3.7参数估计:是根据一个随机样本的统计值来估计总体的参数值。包括点估计和区间估计。3.8点估计:用样本的统计值估计总体的参数值。3.8.1从总体中随机抽取n个样本,随着n的增大,所有样本均值的平均值是总体均值的无偏估计。3.8.2从总体中随机抽取n个样本,随着n的增大,所有的样本成数(比例)的平均值是总体成数(比例)的无偏估计。3.8.3从总体中随机抽取n个样本,随着n的增大,所有的样本方差的平均值是总体方差的无偏估计。3.8.4样本方差和总体方差的计算公式有区别,样本方差要以n-1
7、为分母。这样计算出来的所有样本方差的平均值才是总体方差的无偏估计。3.9区间估计:用样本统计值来推测总体参数的可能范围。3.9.1区间估计的思想是寻找两个统计量,分别来估计总体参数的上限和下限,使得总体参数落在上下限之间内的概率为1-α。1-α就是估计区间包括真值的概率,称为置信概率/置信水平/置信系数。这个区间就叫做“在1-α置信水平下参数的置信区间”。区间的边界叫置信上限和置信下限。α是事先给定的小正数。第3页共14页3.10样本均值的标准差叫做均值标准误。3.10.1标准差和标准误的区别:标准差(standarddev
8、iation):根据原始的观察值计算,反映的是一组原始数据的离散程度;标准误(standarderror):是指样本统计量的标准差。根据样本统计量计算的,反映的是统计量的离散程度;比如,样本均值的标准误差根据多个样本的样本均值计算,反映样本均值的离散程度。σs.e.=n3.11假设检验:是
显示全部收起
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。