第二章 统计学基础回顾.ppt

第二章 统计学基础回顾.ppt

ID:61836748

大小:599.00 KB

页数:31页

时间:2020-02-07

第二章   统计学基础回顾.ppt_第1页
第二章   统计学基础回顾.ppt_第2页
第二章   统计学基础回顾.ppt_第3页
第二章   统计学基础回顾.ppt_第4页
第二章   统计学基础回顾.ppt_第5页
资源描述:

《第二章 统计学基础回顾.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第二章统计学基础回顾2.1统计数据的整理与描述2.2几种重要的概率分布2.3多元分布的基本概念2.4多元正态分布2.5参数估计2.6假设检验思考与练习2.1统计数据的整理与描述统计学是研究数据的方法论学科,统计数据是统计学研究的主要内容。借助统计学方法研究任何实际问题,首先要做的工作是收集数据。收集数据的一般方法是查阅各种统计年鉴和报表,再就是运用某种调查方法获取研究问题的有关数据。抽样调查获取数据的方式在我国方兴未艾。对抽样方法及其应注意的问题有兴趣者可参阅参考文献[5]和[6]。一、总体与样本1.总体:在一个统计问题中,通常把所

2、要调查研究的事物及现象的全体称为总体。2.个体:把组成总体的每个元素(成员)称为个体。3.总体的容量:一个总体中所含的个体的数量称为总体的容量。例如:要研究某城市居民的家庭收入状况,那么这个城市所有家庭的收入状况是研究的总体,而每个家庭的收入状况就是个体。4.抽样:为了推断总体的某些特征,需要从总体中按一定的抽样技术抽取若干个体,将这一抽取过程称为抽样。5.样本:所抽取的部分个体称为样本。6.样本容量:样本中所含个体的数量称为样本容量。例如:研究居民家庭收入时,随机抽取1000户来进行调查,这1000户就是一个样本,样本容量就是10

3、00.二、统计量通过抽样或查统计年鉴得到的原始数据,一般是杂乱无章的,很难从中直接看出有价值的东西。因此,需要对原始数据进行整理。画原始数据的散点图、饼图、直方图等方法是直观表达数据的常见方式。统计学中最主要的提取信息方式就是对原始数据进行一定的运算,以算出某些代表性的数字。用以反映出数据某些方面的特征,这种数字被称为统计量。用统计学语言表述就是:统计量是样本的函数,它不依赖任何未知参数。均值和方差是最常用的统计量。均值是对数据集中特征的描述,方差是对数据波动特征的描述。设是一组独立的随机样本,则样本均值为:样本方差为:样本标准差为

4、:例如:有两组数据(4,6,8,10,12)(6,7,8,9,10)它们的均值都是8,说明两组数据都是以8为中心。计算可知,第一组数据的方差比第二组的要大,说明第一组数据相对均值8来说比较分散,而第二组数据相对均值8来说比较集中。需要注意的是:方差带单位没有意义,标准差带上单位才有实际意义。三、变异系数如果两组数据的计量单位相同,且均值一样,可以利用标准差来比较两组数据的离散程度。但是两组数据的计量单位不同或均值不同时,就不能直接比较两组数据的标准差来分析两组数据的离散程度。由此引入变异系数V:例如:两组数据(4,5,6,7,8)与

5、(40,50,60,70,80)的标准差分别是1.58和15.8,如果仅从标准差来看显然第二组数据分散程度较大。但是由于两组数据的均值不同,分别为6和60,单纯由标准差来判断数据的分散程度就不合适。当我们计算出两组数据的变异系数时,得到V都是0.26.比较而言,两组数据的分散程度就是相同的了。四、偏度与峭度偏度和峭度是描述统计数据分布偏斜程度的统计量。偏度用偏度系数V1来描述:式中,S为样本标准差。偏度系数V1的意义由图2-1可表示出来。V1=0V1>0V1<0V2=3V2>3V2<3五、累积频数分布在社会经济调查中,经常得到的数据

6、时频数。例如家庭月收入按等级划分时,我们就会得到每个等级的家庭数,常常将这些数据列在表中或画成直方图。读者可依收入等级从高到低画出累积频数的直方图。表2-1是家庭收入累积频数分布表。收入等级家庭数频数累积频数5000~60008008006001~700070015007001~800050020008001~90003002300在社会经济研究中,洛伦兹曲线是累积频数的典型应用。如果按收入从低到高排列,个收入等级的家庭的累积数(百分比)为横坐标,与之相对应的收入的累积(百分比)为纵坐标,所得到的曲线就是西方经济学中著名的洛伦兹曲线

7、。在宏观经济的收入差距研究中,就可运用这一描述方法。关于累积频数的百分比曲线可拓宽到衡量贫富差距的基尼系数。基尼系数理论在中国当今的宏观经济研究中非常有用。2.2几种重要的概率分布一、正态分布在经济研究和工商管理中,有许多随机变量的概率分布都可用正态分布来描述。正态随机变量X的概率密度函数的形式如下:式中,为随机变量X的均值;为随机变量X的方差。通常对具体均值为,方差为的正态概率分布,记为N(,)。一般来说,正态分布的密度曲线是以为中心,在的两侧呈对称的形状,曲线的形状像一个钟的剖面,故称为钟形曲线。越大,密度曲线的峰度越低;越小,

8、密度曲线的峰度越高。无论参数和取何值,密度曲线下所覆盖的面积均等于1。正态分布的密度曲线见图2-4(P19)。正态分布曲线下,位于,,之间的面积分别约占总面积68.26%,95.45%和99.73%,如图2-5(P20)所示。在正态分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。