资源描述:
《《抽样误差和t分布》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、抽样误差和t分布荀鹏程Samplingerrorandtdistribution抽样误差的概念由抽样引起的样本统计量与总体参数间的差异两种表现形式样本统计量与总体参数间的差异样本统计量间的差异抽样研究个体变异抽样误差产生的条件均数的抽样误差及标准误表现一:样本均数与总体均数之差值表现二:多个样本均数间的离散度中心极限定理(centrallimittheorem)从均数为、标准差为的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数为,标准差为。标准误(standarderror,SE),样本统计量的标准差称为标准误,用来衡量抽
2、样误差的大小。样本均数的标准差称为标准误。此标准误与个体变异成正比,与样本含量n的平方根成反比。实际工作中,往往是未知的,一般可用样本标准差s代替:因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布,见图3.1。图3.1描述了来自不同总体的样本均数之抽样误差和抽样分布规律。事实上,任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。标准差与标准误的联系和区别联系都是变异指标。S反映个体观察值的变异;反映统计量的变异。当n
3、不变时,标准差↑,标准误↑标准差与均数结合,用于描述观察值的分布范围,如医学参考值范围的估计;标准误与均数结合,用于估计总体均数可能出现的范围,如参数估计的置信区间。t分布设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为和s,设:则t值服从自由度为n-1的t分布(t-distribution)。Gosset于1908年在《生物统计》杂志上发表该论文时用的是笔名“Student”,故t分布又称Studentt分布。f(t)=∞(标准正态曲线)=5=10.10.2-4-3-2-1012340.3图3.2自由度分别为1、5、∞时的t分布t
4、分布的特征t分布为一簇单峰分布曲线t分布以0为中心,左右对称t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高,;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。每一自由度下的t分布曲线都有其自身分布规律t分布表明,从正态分布总体中随机抽取的样本,由样本计算的t值接近0的可能性较大,远离0的可能性较小。t0.05,10=2.228,表明,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025。P(t≤-2.228)+
5、P(t≥2.228)=0.05或:P(-2.2286、基本上都可以算出一個標準差(當然,就理論上的群體分布而言,是有可能不存在標準差.)從群體抽樣,可以計算樣本平均數,樣本標準差等等.但這些由樣本算出的量,所謂"統計量"(statistic),本身也有個機率分布,稱為這統計量的"抽樣分布"(samplingdistribution).舉個簡單的例子,群體數據是{1,2,3,4,5,6}.你可以計算這群體的平均數,標準差,中位數,四分位數等等一堆量.現在從這群體去抽樣,假設n=3.如果不重複(抽出後不放回,或一次抓3個),可能抽到(1,2,3),也可能抽到(1,3,6).有20種不同組合.每一種組合就是
7、一個可能的樣本.以(1,3,6)這樣本來說,樣本平均數是10/3=3.33;但以(1,2,3)這個樣本來說,樣本平均數是2.有20種不同樣本組合,就有20個或相等或不等的樣本平均數.這20個樣本平均數當做資料,它也構成一個分布,就是 從{1,2,3,4,5,6}這群體隨機抽取n=3之樣本的樣本平 均數抽樣分布.(好長的名詞!)這個分布本身也有個標準差.現在問題來了!名詞從這裡開始有點混亂.還是簡單地說.我說"名詞混亂",是因為有新舊不同說法.[以前]如上述樣本平均數抽樣分布的標準差,就稱為"樣本平均數的標準誤".類似地,我們可以有樣本比例的標準誤,樣本
8、標準差的標