第四章:统计描述与统计推断ppt课件.ppt

第四章:统计描述与统计推断ppt课件.ppt

ID:58670133

大小:782.00 KB

页数:102页

时间:2020-10-05

第四章:统计描述与统计推断ppt课件.ppt_第1页
第四章:统计描述与统计推断ppt课件.ppt_第2页
第四章:统计描述与统计推断ppt课件.ppt_第3页
第四章:统计描述与统计推断ppt课件.ppt_第4页
第四章:统计描述与统计推断ppt课件.ppt_第5页
资源描述:

《第四章:统计描述与统计推断ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章:统计描述与统计推断1、统计描述2、统计推断3、统计描述与统计推断的操作1、统计描述调查杭州市居民收入情况,得到1000个样本数据,根据这些数据,你最想得到哪些信息?调查顾客对产品的满意度情况,获得500个样本数据,能分析出哪些信息?调查大学生群体中对手机品牌的偏好程度,你如何描述调查结果?1.1集中趋势的(描述)统计量1.2离散趋势的(描述)统计量1.3分布特征的(描述)统计量1.4其它趋势的(描述)统计量(描述)统计量:用来描述样本特征的概括性的数字度量1.1集中趋势的(描述)统计量均数(M

2、ean):算术均数、加权均数、几何均数、调和均数、截尾均数中位数(Median)众数(Mode)1.2离散趋势的(描述)统计量极值与极差:极大值(Maximum)、极小值(Minimum)、极差(全距)(Range)方差(Variance)总体方差样本方差标准差(Std.Deviation)变异系数(CoefficientofVariation):四分位数(Quartiles)四分位数(Quartiles)下四分位点Q1的位置=(n+1)*0.25上四分位点Q3的位置=(n+1)*0.75当下、上四分

3、位点的位置为整数时,相应整数位置上的样本值就是Q1,Q3的值如不为整数,Q1,Q3值的计算公式:Q1=Q1位置左边的样本值+(Q1位置右边的样本值-Q1位置左边的样本值)*0.25Q3=Q3位置左边的样本值+(Q3位置右边的样本值-Q3位置左边的样本值)*0.75四分位(数间)距QR=Q3–Q1Q1/QLP25Q3/QuP751.3分布特征的(描述)统计量(1)偏度(Skewness):描述某变量所有取值分布形态的对称性的统计量。偏度为0表示其数据分布形态与正态分布偏度相同,左右对称;偏度大于0表示正

4、偏差数值较大,为正偏又称右偏,有一条长尾拖在右边,偏度小于0则相反;偏度的绝对值大于1时,被称为高度偏态分布,当绝对值大于0.5小于1时被称为中等偏态分布。分布特征的(描述)统计量(2)大于0,更陡峰度(Kurtosis):描述某变量所有取值分布形态陡缓程度的统计量。峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。1.4其它趋势的(描述)统计量百分位数(Percentile)把数据分成一百份比(Ratio)

5、:比值构成比(Proportion):比例率(Rate):比率频数与频率(Frequency)M统计量(M-Estimators)2、统计推断2.1正态分布2.2参数估计2.1、正态分布若连续性随机变量X的概率分布密度函数为其中,为均数,为标准差,则称随机变量X服从正态分布(NormalDistribution),记为不同的均数,不同的标准差的正态分布示意图正态分布几个典型区间的面积μ±σ区间的面积68.27%μ±1.64σ区间的面积90.00%μ±1.96σ区间的面积95.00%μ±2σ区间的面积9

6、5.45%μ±2.58σ区间的面积99.00%μ±3σ区间的面积99.73%标准正态分布若某连续性随机变量X服从正态分布(NormalDistribution),记为其中,为均数,为标准差,则经过以下变换变成均数为0,标准差为1的标准正态分布(StandardNormalDistribution),记为2.2、参数估计2.2.1点估计2.2.2区间估计2.2.1、点估计点估计也称定值估计,它是以抽样得到的样本统计量作为总体参数的估计值,并以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法。点

7、估计的方法有矩估计法、极大似然估计法、最小二乘法等。2.2.2、区间估计就是以一定的概率保证估计包含总体参数的一个值域(区间),即根据样本统计量和抽样平均误差推断总体参数的可能范围(区间)。包括两部分内容:一是这一可能区间的大小;二是总体参数落在这一可能区间内的概率。区间估计既说清估计结果的准度,又同时表明这个估计结果的精度。(均数)标准误(差)(S.E.mean)假设一个已知正态分布的总体,从中进行抽样研究,每次抽样的样本量固定为n,对每一个样本可以计算出其均数。由于这种抽样可以进行无限多次,这些样

8、本的均数服从正态分布。抽样均数分布示意图区间估计的计算结合样本统计量和标准误(差),确定一个具有较大准度(置信度或置信水平)1-(通常是95%或99%)包含总体参数的区间,该区间称为总体参数的置信区间(ConfidencdInterval),称为显著性水平。若已知总体服从正态分布,已知,未知从中进行重复抽样,每次抽样的样本量固定为n,每一个样本可以计算出其均数,这些样本的均数服从正态分布总体均值按照显著性水平为,置信度1-计算出的置信区间是其中,是标准正

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。