资源描述:
《《多元回归分析》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、多元迴歸分析遺漏變數偏誤多元迴歸模型多元迴歸模型的估計多元迴歸模型:實例變異數分析與參數檢定多元迴歸模型的幾個重要議題遺漏變數偏誤我們將不再假設解釋變數為固定值,而是隨機變數在簡單迴歸模型中,只有一個解釋變數,然而,在大多數的情形下,被解釋變數Y通常可被一個以上的變數所解釋。舉例來說,所得水準除了受到教育程度的影響之外,亦可能受到工作經驗等其他變數所影響遺漏變數偏誤此外,只考慮一個解釋變數時,可能會產生遺漏變數偏誤(omittedvariablebias)考慮解釋變數(如教育程度)與另外一個變數(如父母所得水準)具相關性,(一般來說,父母所得越高,子女能夠
2、得到的教育越好,教育程度自然越高)且該變數(父母所得水準)本身亦會直接影響被解釋變數(所得水準),(一般來說,父母所得越高,投注在子女身上的其他資源越多,子女的所得也因而越高)遺漏變數偏誤如果我們在迴歸模型中忽略了此變數,就會造成遺漏變數偏誤假設原有解釋變數為X,遺漏變數為Z,而被解釋變數為Y。換句話說,一個變數是否為迴歸模型中的遺漏變數,必須符合以下兩條件:該變數與模型原有的解釋變數相關:Corr(X,Z)≠0。該變數Z亦會直接影響被解釋變數Y。SupposethetruemodelisTheestimatedmodelisThecovariancebe
3、tweenXianderrortermis6Therefore,Since<0(theeffectofPctELonTestScore)andCov(Xi,Zi)>0,wehave7遺漏變數的影響遺漏變數偏誤不會隨樣本增加而變小簡言之,如果我們忽略了遺漏變數,將使原有的解釋變數的估計式不是參數的一致估計式遺漏變數偏誤決定於
4、Cov(X,Z)
5、的大小若Cov(X,Z)>0,則存在正向偏誤(高估欲估計的參數);反之,若Cov(X,Z)<0,則存在負向偏誤(低估欲估計的參數)。Anexampleofomittedvariablebias:MozartEffect
6、?ListeningtoMozartfor10-15minutescouldraiseIQby8or9points.(Nature1993)StudentswhotakeoptionalmusicorartscoursesinhighschoolhavehigherEnglishandmathtestscoresthanthosewhodon’t.9多元迴歸模型我們將只考慮一個解釋變數的簡單迴歸模型擴充為如下的多元迴歸模型:其中,X={X1,...,Xk}就是模型中的k個解釋變數,ei為隨機干擾項,且yx1b0ResponsePlane(Observedy
7、)eiPopulationMultipleRegressionModelBivariatemodel:x2(x1i,x2i)是未知參數,其意義為亦即在控制其他變數影響之情況下,第j個解釋變數對於Y的淨影響多元迴歸模型:薪資所得,教育程度與工作經驗多元迴歸模型為薪資所得=β0+β1×教育程度+β2×工作經驗+ei,簡單迴歸模型為薪資所得=α+β×教育程度+ei,可以確定的是,β1與β都是用來探討教育程度對於薪資所得的影響,但是β1與的詮釋卻不相同β單純地衡量教育程度如何影響薪資所得,亦即,教育程度增加一單位(譬如說增加一年),薪資所得將增加β單位然而,我們知
8、道影響薪資所得的解釋變數應該不只一個,因此,一旦我們將其他可能的解釋變數考慮進來(本例中的工作經驗),則β1詮釋為:「在給定相同的工作經驗下,教育程度增加一單位,薪資所得將增加β1單位」多元迴歸模型這就是在經濟學的研究中,我們時常探討所謂的「其他情況不變下」(ceterisparibus),變數之間的關係譬如說,其他情況不變下,價格如何影響需求量。或者是,其他情況不變下,工資率如何影響勞動供給多元迴歸模型的估計欲估計迴歸模型中的未知參數,我們知道相互獨立,最小平方法為多元迴歸模型的估計因此,尋找來極大透過我們可以得到k+1條標準方程式,進而解出許多商業軟體
9、如EXCEL都能夠輕易地幫你找出這些估計值Estimationofσ2Foramodelwithkindependentvariables多元迴歸模型:實例阿中為一物流送貨員,時常在外奔波運送貨品。阿中的老板懷疑阿中利用在外送貨的空檔開小差,因此,阿中的老板將他以前的送貨行程記錄調出根據多元迴歸模型:其中,Y=在外奔波時數,X1=送貨路程,而X2=送貨點個數阿中的老板估計出如下的迴歸模型在固定的送貨點個數下,阿中的送貨路程每多一公里,在外奔波時數增加0.066小時;在相同的送貨路程下,阿中的送貨點每多一個,在外奔波時數增加0.694小時其中,在本例中,以及
10、根據自由度為n−(k+1)=10−(2+1)=7的t分配,在顯著水