资源描述:
《一些与常态分配有关的机率分配》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、3一些與常態分配有關的機率分配這個講次介紹以下的統計分配:(1)常態分配(Normaldistribution),(2)卡方分配(Chi-Squareddistribution),(3)Studenttdistribution,(4)Fdistribution,以及(5)Lognormaldistribution。最後,我會教你如何在STATA進行併檔(merge)的工作。如果對這些分配有基本的瞭解以後,可以幫助我們更有效的學習抽樣分配與如何進行假說檢定的分析。2007.08.28(firstversion);200
2、7.10.12(thisversion)3.1常態分配假設隨機變數x服從一個平均數為μ而變異數為σ2的常態分配(亦即x∼N(μ,σ2)),則其機率密度函數(pdf)為:1−(x−μ)2f(x)=√exp()(3.1)σ2π2σ2而其累積機率密度函數(cdf)則為:xF(x)=f(x)(3.2)−∞至於所謂的「標準化常態分配」(standardnormaldistribution)則是一個平均數為0,標準差為1的特殊常態分配。換言之,令x−μz=(3.3)σ則新的隨機變數z就成為標準常態分配。許多人習慣以φ(z)與
3、Φ(z)分別代表標準常態分配的pdf與cdf。換言之,在常態分配的前提下,如果你對機率Pr(c1≤x≤c2)有興趣,可以利用以下的方式去查表:c1−μx−μc2−μPr(c1≤x≤c2)=Pr(≤≤)=Pr(d1≤z≤d2)(3.4)σσσ143.2卡方分配15而具體的查表方式則為Φ(d2)−Φ(d1)。至於以下的第(3.5)式是一個你很熟悉的公式,它告訴我們常態分配在±1.96個標準差內的機率為95%。1Pr(−1.96σ≤x≤1.96σ)=Φ(1.96)−Φ(−1.96)=0.95(3.5)3.1.1STATA指
4、令:normal你可以利用MATA去計算Φ(z)(以後會教你其他的方式)。.clear.mata(進入MATA):x1=normal(0)(計算Φ(0)=0.5):x1:mataclear(刪除所以之前的變數⇒將x1從記憶體中刪除):area1=normal(1)-normal(-1)(Φ(1)−Φ(−1)=0.6826894921):area1:area2=normal(0.5)(Φ(0.5)=0.6914624613):area3=1-(normal(2)-normal(-2))(計算1−Pr(−2≤z≤2)):
5、area3:mataclear:end(離開MATA).3.2卡方分配在介紹卡方分配前,我們可以粗略地瞭解以下的gamma分配(其參數為α與β,且α>0與β>0):yα−1e−y/βf(x)=(3.6)βαΓ(α)∞其中Γ(α)=yα−1e−ydy。0在gamma分配中:μ=E(x)=αβ而σ2=Var(x)=αβ2。只要令α=v/2且β=2,就可以得到所謂的Chi-Squared分配。再利用先前的公式可知,若某個隨機分配服從Chi-Squared分配,那麼他的期望值與變異數將分別為v與2v。此時,這個v就是該Ch
6、i-Squared分配的自由度(degreeoffreedom,簡稱為df)。1你可以到圖書管借閱有關「六標準差」的書籍。3.3t分配16習慣上,卡方分配常以χ2n加以表示,其中的n就是Chi-Squared分配的唯一參數(期望值與變異數將分別為n與2n)。一個有趣的統計事實是,若zi(i=1,...,n)為n個彼此獨立的常態分配,則他們的平方和(sumofsquared)會服從一個參數為n的Chi-Squared分配。具體來說:nχ2=z2(3.7)n∑ii=1你可以查表發現:Pr(χ2≤7.81)=95%(3.8
7、)n=33.2.1STATA指令:chi2你可以利用MATA去計算χ2的累積機密度函數。此外,如果你仔細觀察第(3.7)式,你可以發現χ2分配的定義域為「非負」。.clear.mata(進入MATA):Chi1=chi2(3,7.91)(卡方分配的cdf):Chi1:Chi2=invchi2(3,0.9520911812)(卡方分配cdf的反函數):Chi2:chi2(3,Chi2):invchi2(3,Chi1):mataclear:end(離開MATA).3.3t分配令Z是一個標準常態分配,χ2則為一個自由度為v
8、的卡方分配。若Z與χ2為獨立的,則以下的變數T稱為「自由度為v」的t分配(studentdistribution)Zt=(3.9)χ2/vt分配的期望值為0,變異數則為v/(v−2)(當v>2)。圖形上來看,t分配與常態分配均為對稱的分配,只不過,相對來說,t分配較寬而常態分配較密。在表達上,常以tv去表示一個自由度為v(df=v)的t分配。