现代统计分析方法与应用第章:统计学基础回顾

现代统计分析方法与应用第章:统计学基础回顾

ID:15051367

大小:74.00 KB

页数:39页

时间:2018-08-01

现代统计分析方法与应用第章:统计学基础回顾_第1页
现代统计分析方法与应用第章:统计学基础回顾_第2页
现代统计分析方法与应用第章:统计学基础回顾_第3页
现代统计分析方法与应用第章:统计学基础回顾_第4页
现代统计分析方法与应用第章:统计学基础回顾_第5页
资源描述:

《现代统计分析方法与应用第章:统计学基础回顾》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第2章统计学基础回顾1、统计数据的整理与描述2、几种重要的概率分布3、多元分布的基本概念4、多元正态分布5、参数估计6、假设检验第一节统计数据的整理与描述一、总体与样本在一个统计问题中,通常把所要调查研究的事物或现象的全体称为总体,而把组成总体的每个元素称为个体,一个总体中所含的个体数量称为总体的容量。从总体中按一定的抽样技术抽取若干个体,将这一过程称为抽样。所抽取的部分个体称为样本,样本中所含个体的数量称为样本容量。对原始数据进行一定的运算,以算出某些代表性的数字,涌以反映出数据某些方面的特征,这种数字被称为统计量二、统计量均值和方差就是最重要的常用统计量。设x1、x2、、xn是一组独立的

2、随机样本,则:样本均值为:样本均值为:样本方差和标准差(simplevarianceandstandarddeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!(例题分析)554001602703202700170200240160250—4030201001020304050120—合计491627201710845145155165175185195205215225235140—150150—160160—170170—180180—190190—200200—210210—220220—230230—2

3、40频数(fi)组中值(Mi)按销售量分组某电脑公司销售量数据离差计算表含义:每一天的销售量与平均数相比,平均相差211>.58台三、变异系数四、偏度1、统计学家Pearson于1895年首次提出2、数据分布偏斜程度的测度:⑴偏态系数=0为对称分布⑵偏态系数>0为左偏分布,数据的分布具有一个较长的右尾;⑶偏态系数<0为右偏分布,数据的分布具有一个较长的左尾;此值大于其标准误的两倍,说明数据的分布不是对称的,也就不是正态的。⑴根据原始数据计算⑵根据分组数据计算3、偏态系数(skewnesscoefficient)(例题分析)70100000102400007290000256000

4、02700000170000160000064800001024000031250000540000-256000-243000-128000-2700001700080000216000256000625000120—合计491627201710845145155165175185195205215225235140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240频数fi组中值(Mi)按销售量份组(台)某电脑公司销售量偏态及峰度计算表结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微左偏分布,即

5、销售量较少的天数占据多数,而销售量较多的天数则占少数按销售量分组(台)结论:1.为左偏分布2.峰态略扁140150210某电脑公司销售量分布的直方图190200180160170频数(天)252015105302202302401、统计学家Pearson于1905年首次提出2、数据分布扁平程度的测度⑴峰态系数=0扁平峰度适中⑵峰态系数<0为扁平分布⑶峰态系数>0为尖峰分布五、峰态3、峰态系数(kurtosiscoefficient)⑴根据原始数据计算⑵根据分组数据计算结论:峰态系数为负值,但与0的差异不大,说明电脑销售量为轻微扁平分布偏态与峰态分布的形状扁平分布尖峰分布偏态峰态右

6、偏分布左偏分布与标准正态分布比较!六、累积频数分布在社会经济调查中,经常得到的数据是频数,并将其画成直方图,同时也可以画出累积频数的直方图。如家庭月收入按等级数据如下表:8001500200023008007005003005000-60006000-70007000-80008000-9000累积频数频数家庭数收入等级(元)洛伦茨(M.E.Lorentz)曲线是累积频数的典型应用。为了研究国民收入在国民之间的分配问题,美国统计学家洛伦茨(或说奥地利统计学家)1907年提出了著名的洛伦兹曲线。画一个矩形,矩形的高衡量社会财富的百分比,将之分为五等份,每一等分为20的社会总财富。在矩形的长上,

7、将100的家庭从最贫者到最富者至左向右排列,也分为5等分,第一个等份代表收入最低的20的家庭。在这个矩形中,将每一百分的家庭所有拥有的财富的百分比累计起来,并将相应的点画在图中,便得到了一条曲线就是洛伦兹曲线。图中横轴OH表示人口(按收入由低到高分组)的累积百分比,纵轴OM表示收入的累积百分比,弧线OL为洛伦兹曲线。基尼系数(GiniCoefficient)是意大利经济学家基尼(CorradoGini,188

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。