资源描述:
《十简单相关与简单直线回归分析SimpleLinearRegressionand》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2021/8/17Jen-peiLiu,PhD1十一、簡單相關與簡單直線回歸分析(SimpleCorrelationsandSimpleLinearRegression)(Chapter11)劉仁沛教授國立台灣大學農藝學研究所生物統計組國立台灣大學流行病學與預防醫學研究所國家衛生研究院生物統計與生物資訊組jpliu@ntu.edu.tw【本著作除另有註明,網站之內容皆採用創用CC姓名標示-非商業使用-相同方式分享3.0台灣授權條款釋出】2021/8/17Jen-peiLiu,PhD2例1:氮肥用量與水稻穀收量表(公斤)氮肥用
2、量x00.51.01.52.02.5稻穀收量y101832485562例2:成人年齡與血液中膽固醇的量年齡x343944464851膽固醇y(mg/ml)141.4180.5178.4212.0203.2224.1年齡x53661656667膽固醇y(mg/ml)186.0350.0286.3287.6330.3371.3例3:年雨量與小麥產量年雨量(公厘/20)23.520.422.825.928.927.126.825.2產量(公斤/100)20.423.033.535.844.641.245.439.02021/8/17
3、Jen-peiLiu,PhD3氮肥用量與稻穀收量的ScatterPlot2021/8/17Jen-peiLiu,PhD4年齡與膽固醇量的ScatterPlot(mg/ml)2021/8/17Jen-peiLiu,PhD5年雨量與小麥產量的ScatterPlot(公斤/100)2021/8/17Jen-peiLiu,PhD6探討兩個變數之間的關係問題:兩個變數間是否存在直線關係?將直線關係以方程式表示資料型態(xi,yi)2021/8/17Jen-peiLiu,PhD7探討兩個變數之間的關係假定(Assumptions)每對資
4、料均為獨立常態相同變方X與Y的關係為直線2021/8/17Jen-peiLiu,PhD8簡單相關係數(Simplecorrelationcoefficient)簡單直線回歸(SimpleLinearRegression)模式建立之推論(ModelsandInference)回歸模式直線性檢定(EvaluationofLinearity)假定之確認(CheckingtheModelAssumptions)2021/8/17Jen-peiLiu,PhD9ⅡⅠⅢⅣⅡⅠⅢⅣⅡⅠⅢⅣμχμχμχμyμyμyy(a)ρ>0正相關(b)ρ<
5、0負相關(c)ρ=0無相關圖11.8b三種不同族群相關散播圖2021/8/17Jen-peiLiu,PhD10象限(χ-μχ)(y-μy)(χ-μχ)(y-μy)Ⅰ+++Ⅱ-+-Ⅲ--+Ⅳ+--2021/8/17Jen-peiLiu,PhD11正相關:落在第Ⅰ及Ⅲ象限的點數>落在第Ⅱ及Ⅳ象限的點數負相關:落在第Ⅰ及Ⅲ象限的點數<落在第Ⅱ及Ⅳ象限的點數無相關:落在第Ⅰ及Ⅲ象限的點數=落在第Ⅱ及Ⅳ象限的點數2021/8/17Jen-peiLiu,PhD12族群簡單相關係數:(x1,y1)…(xN,yN),-1<ρ<12021/8/
6、17Jen-peiLiu,PhD13樣品簡單相關係數樣品資料:(x1,y1),…,(xn,yn)乘積和:X平方和:Y平方和:2021/8/17Jen-peiLiu,PhD14樣品簡單相關係數樣品資料:(x1,y1),…,(xn,yn)r之範圍:-1≦r≦12021/8/17Jen-peiLiu,PhD15xyr=1xyr=-1(a)完全正相關(b)完全負相關2021/8/17Jen-peiLiu,PhD16(a)不完全正相關(b)不完全負相關xy07、=0xyr=0(a)無相關(b)曲線關系2021/8/17Jen-peiLiu,PhD18簡單相關係數顯著性檢定H0:ρ=0v.s.Ha:ρ≠0顯著水準:α檢定統計值:決策方法:若|T|>tα/2,n-2拒絕H02021/8/17Jen-peiLiu,PhD19例:雨量與小麥產量n=8,Σxi=200.5,Σyi=296.52021/8/17Jen-peiLiu,PhD20簡單直線回歸(SimpleLinearRegression)水稻穀產量期望值E(y)與氮肥用量(x)可以用直線關係描述E(yi)=β0+βxi,i=1,…,
8、6(=n)yi:依變數(Dependentvariable)xi:獨立(自)變數(Independentvariable)β0:截距(Intercept)x=0時y的值β:斜率(Slope)x變動一個單位y變動的量但實際觀測值與直線E(y)=β0+βx有差距原因:環境、實驗誤