资源描述:
《生物统计学 第五章 t分布》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第五章t分布与t检验第一节样本平均数的抽样分布和t分布1.抽样分布1.1总体和样本的关系总体→样本(一般→特殊)主要研究所抽取样本的分布,亦即变异特点(抽样分布)样本→总体(特殊→一般)主要从样本的结果去推断原来总体的结果(统计推断)t分布&t检验1.2统计量统计推断中,建立的样本各种函数,包含有关总体信息,这种样本函数称为统计量,如:?,S。总体X1X2X3X4X5X6…Xn样本统计量(如?)?1?2?3…函数(统计量)f(x)1.3抽样分布从一个总体中,按一定的样本容量随机抽取所有可能的样本,由这些样本计算出的统计量
2、[样本函数f(x);?,?2]必然形成一种分布(亦即一个新的总体),这种分布称为该统计量的随机抽样分布或抽样分布。t分布&t检验[实例]在一个N=4的有限总体中,存在变数2,3,3,4。根据μ=Σx/N和σ2=Σ(x-μ)2/N求得该总体的μ、σ2、σ为:μ=3,σ2=1/2,σ=12=0.707从有限总体作返置随机抽样,如果从中抽取n=2的样本,共可得?1×?1=16个样本;如果样本含量n为4,则一44共可抽得?1×?1×?1×?1=256个样本。4444当n=2时的组合有:2-3,2-3,2-4,3-3,3-4,3-
3、4,4-3,4-3,4-2,3-3,3-2,3-2,2-2,3-3,3-3,4-4等共16种组合。分别求这些样本的平均数,其次数分布下表:t分布&t检验t分布&t检验在n=2的试验中,样本平均数抽样总体的平均数、方差与标准差分别为:fx/f48.0/163x2f(xx)2fx2(fx)2/Nn148482/16xff162=4/16=1/4=(1/2)/2=/n2xx1/412/2nn=4时:x768/256322x32/2561/8(1/2)/
4、4/n114x82nt分布&t检验图4-12平均数的抽样分布t分布&t检验1.4样本平均数的抽样分布特点(1)正态总体抽样的样本平均数定理若随机变量X服从正态分布X~?(?,?2),?,1?2,…,??是X的随机变量,则:样本平均数?=(??)服从平均数为?,方差为?2/n的正态分布,?即:?~?(μ,σ2/2)。t分布&t检验(2)样本平均数差异的分布假设:?~?(?,?2)随机抽样?1111?~?(?,?2)随机抽样?2222则:从两个独立正态总体中抽出的独立样本平均数差数(?1−?2)的分布也是正态分
5、布,即:(?−?)~N(?-?,?2?+?2?)12121122注意:两个独立样本平均数进行比较时,要根据总体的方差已知还是未知,以及两个总体的方差是否相等,选用不同的检验统计量。t分布&t检验(3)任意样本平均数的极限分布中心极限定理:如果被抽样本总体不是正态分布,但具有一定的平均数?和方差σ2,则随样本容量n的不断增大,样本平均数?的分布越来越趋近于正态分布,且具有平均数?和方差σ2/n,这就是中心极限定理。中心极限定理应用:该定理对于连续性变量或非连续性变量都适用。不论总体为何种分布,一般只要样本容量n≧30,属于
6、大样本,就可以用中心极限定理,认为样本平均数?的分布是正态分布。t分布&t检验2样本标准误??=?的大小反映样本平均数??的抽样误差的大小,即精确性的高低。值越小越精确。可用样本标准差S估计σ,即有:222S(xx)x(x)/nSxnn(n1)n(n1)标准差S和样本标准误??区别样本标准差反映观察值x1x2…xn等变异程度,与?代表性强弱有关。大样本资料用?±?表示。样本标准误??是?抽样误差的估计值,反映了样本间变异程度的大小及?精确性。小样本用?±??表示。t分布&t检验3t分布(1)定义?1
7、,?2,…,??(n≧2)相互独立,且都2(?−?)(?−?)服从?(?,?),则变量?==(t值)服????从自由度df=n-1的t分布,记作T~t(n-1)。2df11[(df1)/2]tt分布的密度函数f(t)(1)2df(df/2)df平均数和标准差μt=0(df>1),tdf/(df2)(df>2)图4-13不同自由度的t分布密度曲线t分布&t检验(2)t分布的性质t分布曲线是左右对称的单峰曲线,以平均数??=0向两侧递降。t分布受自由度df=n-1的制约,每个自由度都有一条t分布曲线
8、。t分布比正态分布离散度大,顶部偏低,尾部偏高,尤其是自由度小的t分布更为明显。当自由度df>30时,t分布比较接近正态分布曲线;当df→+∞时,则和正态分布曲线吻合。t分布&t检验(3)t检验的适用条件已知一个总体均数;可得到一个样本均数及该样本标准差;样本来自正态或近似正态总体。(4)t分布两尾概率表(