欢迎来到天天文库
浏览记录
ID:26437698
大小:1.21 MB
页数:26页
时间:2018-11-27
《第 九 章 簡單迴歸分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、簡單迴歸分析1.簡單迴歸分析當討論兩變數的資料時,我們會問兩個問題,第一個問題是這兩個變數間有無關係,如有關係,它的關係有多大(相關係數)。另一個問題是一變數對另一變數有何影響(迴歸分析)。迴歸的目的就是要找出變數間的關係式,即找函數f,使應變數y(DependentVariable,或稱準則變數)與獨立變數x(IndependentVariable或稱預測變數)間有:y=f(x)的關係式,最簡單的函數f是線性函數,即f(x)=我們稱這種線性關係式y=為簡單線性迴歸模式(SimpleLinearRegressio
2、nModel),其中稱為迴歸係數(RegressionCoefficient,表示直線斜率),表示截距(Intercept,表示迴歸線與y軸交點的縱座標)。當收集到一組資料後,迴歸第一步驟就是估計,(後面將介紹最小平方法求,的估計),然後再利用殘差圖評估模式是否合適,如不合適則做修正,直到修正模式評估合適為止,模式修正好後,就能利用建立的迴歸模式做預測、解釋及控制等用途。1.1散佈圖通常迴歸模式是未知的!一般是由已有的資料(x1,y1),…,(xn,yn)之散佈圖得知其輪廓。所謂散佈圖(ScatterDiagra
3、m)通常畫在二度空間上,y軸表示應變數,x軸代表獨立變數,散佈圖是相關與迴歸分析最基本的工具,如果散佈圖上的點愈接近形成一直線,表示這兩個變數的關係愈密切。反之,如果散佈圖呈圓形,表示這兩個變數沒有什麼關係,也就是說獨立變數對應變數沒有什麼影響力,因之預測能力就很差。以下舉幾個例子說明散佈圖的畫法。79例1:某汽車公司想了解廣告費x對銷售費y的影響,收集過去12年的資料如下:表1某汽車公司過去12年新車銷售量與廣告費資料年代T廣告費x(萬元)銷售量y(輛)73510100074550110075600125076
4、58012807770013607875014807986015008093017208110501800821030189083120021008413202200圖1中(700,1360)是77年的資料,由圖上看出這12年的資料隱約的在一直線附近,將這條直線畫出如下圖,這條“最靠近”這些點的直線,就稱為“代表線”或稱“迴歸線”。繪製其散佈圖如下:圖1銷售量對廣告費的散佈圖79圖2銷售量對廣告費的迴歸線1.2簡單線性迴歸分析簡介迴歸分析(RegressionAnalysis)是一種統計分析方法,它利用一組預測變
5、數(或稱獨立變數)的數值,對某一準則變數(或稱應變數)做預測,它也可以做為評估預測變數對準則變數的影響程度。很不幸地,迴歸(Regression)的名字取得不理想,從字面上並不能表現出這種方法的重要性及其應用,取名實際上來自於1885年高登(Galton)所寫的論文“RegressionTowardMediocrityinHeredityStature”。大致來說,其意義為:如果一些未知的獨立變數之影響程度消失,其應變異數應些一迴歸線。迴歸的主要目的是做預測,目標是發展一種能以一個或多個預測變數的數值來做為應變數
6、預測的方法。本單元將探討“簡單”線性迴歸模式,也就是只用一個獨立變數x去預測應變數y的模式。我們常問像下面的兩個問題:能不能由學生的IQ成績預測其大學聯考成績?是否能由大學聯考成績預測大一微積分成績?79統計學主要應用之一是做預測,一般預測需要先收集資料,然後建立模式,再由給定的預測變數值,求出對應的準則變數值是多少?迴歸分析就是找出變數間的關係式。我們將變數分成兩類,一類變數是做為預測提供者,稱為獨立變數(IndependentVariable)或稱為預測變數(PredictorVariable),以x表示,另
7、一類是我們真是關心的被想預測者,稱為應變數(DependentVariable)或準則變數(ResponseVariable),以y很示。所謂建立模式,就是找出y與x的函數關係式,即找函數f滿足y=f(x)最常用的函數f是線性函數,即f(x)=而y=稱為簡單線性迴歸(SimpleLinearRegression)模式例如森林農場關心明年的木材總收成是多少?當然等到砍伐就能算出收成的總體積,但如能在未砍伐前能做預測,則有很多行銷方面的好處,如何做收成的預估,方法當然有很多種,例如:(1)可根據過去幾年收成資料做下年
8、度的預測(時間數列)。(2)可根據過去幾年砍伐面積與收成的木材體積做下一年的預測(簡單線性迴歸)。(3)可根據樹木的棵數,及每棵樹的高度及樹幹的直徑等做預測(複迴歸)。以上幾種方法都是可行的,至於那一種方法做預測較好有待評估,不過,不論用何種方法,首先必須收集資料,然後設定模式,才能做預測。以第二種方法為例,假設收集過去10年砍伐面積與收成木材體積資料如下:表2森林農場十
此文档下载收益归作者所有