欢迎来到天天文库
浏览记录
ID:36869780
大小:297.10 KB
页数:63页
时间:2019-05-10
《《应用统计复习》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第一章数据与统计学统计学的产生和发展统计数据的来源统计数据的质量统计学的基本概念统计调查的方式全面调查非全面调查抽样调查典型调查重点调查普查报表制度统计调查(主要用来取得社会经济数据)统计数据的质量数据误差抽样误差非抽样误差回答误差无回答误差汇总误差调查员误差第二章统计数据的描述数据的计量尺度统计数据的整理分布集中趋势的测度分布离散程度的测度分布偏态与峰度的测度统计表与统计图第二章统计数据的描述数据的计量尺度列名尺度(nominalscale)性别、民族顺序尺度(ordinalscale)产品等级、满意度间隔尺度(intervals
2、cale)百分制成绩、温度、年龄比例尺度(ratioscale)产量、产值、利润品质标志数量标志第二章统计数据的描述分布集中趋势的测度众数中位数均值对分组数据进行计算的公式常用函数平均值average(array)众数mode(array)中位数median(array)四分位数quartile(array,n)n=01234几何平均数geomean(array)切尾均值trimmean(array,percent)偏态系数skew(array)峰度系数kurt(array)方差(样本)var(array)标准差(样本)st
3、dev(array)第三章概率分布与抽样分布概率分布常用抽样方法抽样分布中心极限定理的应用正态分布X~N(μ、σ2),其概率密度为:NORMDIST(X,μ,σ,0)正态分布随机变量的均值和标准差均值E(X)=μ方差D(X)=σ2-∞4、x标准正态分布μ=0、σ=1的正态分布,记为N(0,1)其概率密度φ(x)分布函数Ф(x),NORMSDIST(Z)X~N(μ、σ2),则:Z~N(0,1)若Z~N(0,1),则有:P(5、Z6、≤a)=2Ф(a)-1Ф(-a)=1-Ф(a)标准化标准正态曲线-a0aφ(z)zΦ(a)正态分布常用的正态概率值(在一般正态分布及标准正态分布中)-2.58-1.96-1.650+1.65+1.96+2.58z-2.58σ-1.96σ-1.65σ+1.65σ+1.96σ+2.58σx99%95%907、%正态分布常用的正态概率值(在一般正态分布及标准正态分布中)-3-2-10+1+2+3z-3σ-2σ-σ+σ+2σ+3σx99.73%95.45%68.27%常用的抽样方法抽样调查是一种常用的统计技术,其目的在于用样本统计量推断我们所关心的总体参数。中心极限定理(centrallimittheorem)中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布当样本容量足够大时(n30),样本均值的抽8、样分布逐渐趋于正态分布一个任意分布的总体x样本均值抽样分布的特征样本均值的数学期望样本均值的方差重复抽样不重复抽样抽样平均误差抽样标准误差样本比例(率)抽样分布的特征当样本容量很大时,样本比例的抽样分布可用正态分布近似样本比例的数学期望样本比例的方差重复抽样不重复抽样中心极限定理的应用例3.33练习题3-23第四章参数估计基本原理一个总体均值的区间估计一个总体比率的区间估计由样本统计量所构造的总体参数的区间估计,称为置信区间(confidenceinterval),其中区间的最小值称为置信下限,最大值称为置信上限。将构造置信区间的步9、骤重复多次,置信区间中包含总体参数真值的次数所占的比率称为置信水平(confidencelevel),或称为置信系数(confidencecoefficient)。一般将α称为显著性水平,1-α置信水平置信区间示意图一个总体均值的区间估计总体均值m所在(1-a)置信水平下的置信区间为:za/2是标准正态分布上侧面积为α/2时的z值。表5.3常用置信水平的za/2值99%95%0.05置信水平aa/2za/21.64590%0.100.050.010.0251.960.0052.58允许误差不同情况总体均值的区间估计总体分布样本容量s10、未知大样本(n≥30)s已知正态分布小样本(n<30)大样本(n≥30)非正态分布一个总体比率的区间估计样本比例置信区间的确定如在40000个家庭中抽取了400个家庭,样本中拥有家用计算机的家庭有72个,试估计总体拥有计算机比例的置信
4、x标准正态分布μ=0、σ=1的正态分布,记为N(0,1)其概率密度φ(x)分布函数Ф(x),NORMSDIST(Z)X~N(μ、σ2),则:Z~N(0,1)若Z~N(0,1),则有:P(
5、Z
6、≤a)=2Ф(a)-1Ф(-a)=1-Ф(a)标准化标准正态曲线-a0aφ(z)zΦ(a)正态分布常用的正态概率值(在一般正态分布及标准正态分布中)-2.58-1.96-1.650+1.65+1.96+2.58z-2.58σ-1.96σ-1.65σ+1.65σ+1.96σ+2.58σx99%95%90
7、%正态分布常用的正态概率值(在一般正态分布及标准正态分布中)-3-2-10+1+2+3z-3σ-2σ-σ+σ+2σ+3σx99.73%95.45%68.27%常用的抽样方法抽样调查是一种常用的统计技术,其目的在于用样本统计量推断我们所关心的总体参数。中心极限定理(centrallimittheorem)中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布当样本容量足够大时(n30),样本均值的抽
8、样分布逐渐趋于正态分布一个任意分布的总体x样本均值抽样分布的特征样本均值的数学期望样本均值的方差重复抽样不重复抽样抽样平均误差抽样标准误差样本比例(率)抽样分布的特征当样本容量很大时,样本比例的抽样分布可用正态分布近似样本比例的数学期望样本比例的方差重复抽样不重复抽样中心极限定理的应用例3.33练习题3-23第四章参数估计基本原理一个总体均值的区间估计一个总体比率的区间估计由样本统计量所构造的总体参数的区间估计,称为置信区间(confidenceinterval),其中区间的最小值称为置信下限,最大值称为置信上限。将构造置信区间的步
9、骤重复多次,置信区间中包含总体参数真值的次数所占的比率称为置信水平(confidencelevel),或称为置信系数(confidencecoefficient)。一般将α称为显著性水平,1-α置信水平置信区间示意图一个总体均值的区间估计总体均值m所在(1-a)置信水平下的置信区间为:za/2是标准正态分布上侧面积为α/2时的z值。表5.3常用置信水平的za/2值99%95%0.05置信水平aa/2za/21.64590%0.100.050.010.0251.960.0052.58允许误差不同情况总体均值的区间估计总体分布样本容量s
10、未知大样本(n≥30)s已知正态分布小样本(n<30)大样本(n≥30)非正态分布一个总体比率的区间估计样本比例置信区间的确定如在40000个家庭中抽取了400个家庭,样本中拥有家用计算机的家庭有72个,试估计总体拥有计算机比例的置信
此文档下载收益归作者所有