非参数统计讲义

非参数统计讲义

ID:40907692

大小:642.00 KB

页数:13页

时间:2019-08-10

非参数统计讲义_第1页
非参数统计讲义_第2页
非参数统计讲义_第3页
非参数统计讲义_第4页
非参数统计讲义_第5页
资源描述:

《非参数统计讲义》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、非参数统计讲义——沈思第一章绪论本章主要内容:1.非参数方法介绍2.预备知识第一节非参数方法介绍一.非参数方法的概念和实例复习参数方法定义:设总体X的分布函数的形式是已知的,而未知的仅仅是分布函数具体的参数值,用样本对这些未知参数进行估计或进行某种形式的假设检验,这类推断方法称为参数方法。先来看两个实例。例1.1供应商供应的产品是否合格?某工厂产品的零件由某个供应商供应。合格零件标准长度为(8.5±0.1)cm。这也就是说合格零件长度的中心位置为8.5cm,允许误差界为0.1cm,即长度在8.4-8.6cm之间的零件是合格的。为评估近年来供应

2、的零件是否合格,随机抽查了n=100个零件,它们的长度数据X见第一章附表1.1。解答:根据我们已学过的参数统计的方法,如何根据数据来判断这批零件合格否?用参数数据分析方法,在参数统计中,运用得最多的是正态分布,所以考虑假设供应商供应的零件长度X服从正态分布,即~其中两个参数均未知,但可用样本均值估计,样本方差估计。由已知的数据计算可得:零件的平均长度,即样本均值为=8.4958cm,样本标准差为s=0.1047cm。则零件合格的可能性近似等于这个说明:约有三分之一的零件不合格,该工厂需要换另一个供销商了。但这个结论与实际数据符不符合呢?这是我

3、们要思考的问题。我们可以对数据做一个描述性分析,先对这100个样本数据做一个频率分布。观察到:在这100个零件中有91个零件的长度在8.4cm~8.6cm之间,所以零件合格的比例为91%,超过66%很多!统计分析的结论与数据不吻合的!这是什么原因呢?我们可以作出数据的直方图来分析数据的分布情况。由图知,该数据的总体不是近似服从正态分布的!所以我们对于数据的总体分布的假设错了!问题就出在假设总体是正态分布上!继续看直方图,能否很容易就观察出来它大概是什么分布呢?答案是不易看出,所以试图先确定数据的分布函数,再利用参数的方法来分析是不太容易的。1

4、3非参数统计讲义——沈思例1.2哪一个企业职工的工资高?这里有22名职工的工资情况,其中的12名职工来自企业1,另外的10名职工来自企业2。他们的工资(单位:千元)如附表1.2。仅从数据来看,显然企业1职工的工资较高。根据我们已学过的参数统计的方法,这个问题用什么方法来解决呢?(提问)采用参数数据分析方法,假设企业1和企业2职工的工资分别服从正态分布和,则该问题转化为假设检验问题:,即两样本t检验。计算可得,检验统计量的值t=1.282。若取α=0.05,其临界值为,不能拒绝原假设,即认为二者没有区别;若取α=0.10,其临界值为,仍不能拒绝

5、原假设!计算p值得到的结论也一样。这个统计分析的结论显然与数据不吻合!之所以有问题,就是因为假设职工的工资服从正态分布的缘故。一般来说,工资、收入等的分布是不对称的,并且有一部分人的工资比较高,所以分布的右边有较长的尾巴。对于以上的这样的问题,若想用参数数据的分析方法,就不能再假设总体服从正态分布,必须给它们赋一个较合理的分布函数,做到这点对于很多实际问题上是难度比较大的。除了这个办法之外,我们还可以用另外的处理办法,例如,非参数统计、参数和非参数方法相结合等等。这门课,我们主要讨论非参数方法。二.非参数统计方法特点1.非参数统计方法通常称为

6、“分布自由”的方法,即非参数数据分析方法对产生数据的总体的分布不做假设,或者仅给出很一般的假设,例如连续型分布、对称分布等一些简单的假设,结果一般有较好的稳定性。所以适用范围非常宽泛。在经典的统计框架下,正态分布一直是最引人注目的,但是对总体的分布不是随便做出来的,如以上两例,盲目地做出正态分布的假设有时候是起反作用的。当数据的分布不是很明确,特别当样本含量不大,几乎无法对分布作推断的时候,此时使用参数方法就有一定的风险,我们就可以考虑用非参数的方法。但要注意,非参数方法是与总体分布无关,而不是与所有分布无关!2.非参数统计可以处理所有类型的

7、数据。我们知道,统计数据按照数据类型可以分为两大类:定性数据和定量数据。一般地,参数统计是处理定量数据,如果所收集到的数据不符合参数模型的假定,比如:数据只有顺序,没有大小,则很多参数模型无能为力,此时只能尝试非参数方法。例如:研究急性白血病患儿血液中血小板数与出血症状之间的关系。血小板数可用数据衡量,但出血症状则只能分为:明显、较明显、有出血点和无这4类。类似于这样的“等级资料”,参数方法没辙,可用非参数方法中的Spearman等级相关方法来做。13非参数统计讲义——沈思3.在不知道总体分布的情况下,如何利用数据所包含的信息呢?一组数据最基

8、本的信息就是次序。非参数统计就是利用这个最基本的信息。如果把数据点按从小到大的次序排队,每一个具体数目都有它在整个数据中的位置,这称为该数据的秩(rank)。非参数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。