欢迎来到天天文库
浏览记录
ID:27677743
大小:1.40 MB
页数:109页
时间:2018-12-05
《直线回归和相关》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第九章直线回归和相关第一节回归和相关的概念第二节直线回归第三节直线相关第四节直线回归与相关的内在关系和应用要点第五节协方差分析引言这一章研究的对象:由一个变数两个或多个变数,因为在实际生产实践和科学实验中所要研究的变数往往不止一个,例如:研究温度高低和作物发育进度快慢的关系,就有温度和发育进度两个变数;研究每亩穗数、每穗粒数和每亩产量的关系,就有穗数、粒数和产量三个变数。第一节回归和相关的概念1.函数关系与统计关系2.自变数与依变数3.回归分析和相关分析4.两个变数资料的散点图函数关系有精确的数学表达式(确定性的关系)
2、 直线回归分析一元回归分析变量间的关系因果关系 曲线回归分析(回归分析)多元回归分析 多元线性回归分析统计关系 多元非线性回归分析(非确定性的关系)简单相关分析——直线相关分析相关关系 复相关分析(相关分析)多元相关分析偏相关分析函数关系是一种确定性的关系,例如圆面积与半径的关系为。其不包含误差的干扰。统计关系是一种非确定性的关系。例如,作物的产量与施肥量的关系,两类变数受误差的干扰表现为统计关系。因果关系:两个变数间的关系若具有原因和反应(结果)的性质。相关关系:呈现一种共同变化的特点,
3、则称这两个变数间存在。回归分析:计算回归方程为基础的统计分析方法。为Y依X的回归方程(regressionequationofYonX)。相关分析:计算相关系数为基础的统计分析方法。计算表示Y和X相关密切程度的统计数,并测验其显著性。这个统计数在两个变数为直线相关时称为相关系数(correlationcoefficient),记为r;在多元相关时称为复相关系数(multiplecorrelation),记作Ry·12…m;在两个变数曲线相关时称为相关指数(correlationindex),记作R。一般规则:当两个变数中Y
4、含有试验误差而X不含试验误差时着重进行回归分析;而当Y和X均含有试验误差时则着重去进行相关分析。4.两个变数资料的散点图对具有统计关系的两个变数的资料进行初步考察的简便而有效的方法,是将这两个变数的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上,获得散点图(scatterdiagram)。根据散点图可初步判定双变数X和Y间的关系,包括:①X和Y相关的性质(正或负)和密切程度;②X和Y的关系是直线型的还是非直线型的;③是否有一些特殊的点表示着其他因素的干扰等。例如图9.
5、1是水稻方面的3幅散点图,图9.1A是单株的生物产量(X)和稻谷产量(Y),图9.1B是每平方米土地上的总颖花数(X)和结实率(Y),图9.1C是最高叶面积指数(X)和每亩稻谷产量(Y)。从中可以看出:①图9.1A和9.1B都是直线型的,但方向相反;前者Y随X的增大而增大,表示两个变数的关系是正的,后者Y随X的增大而减小,表示关系是负的。②图9.1A的各个点几乎都落在一直线上,图9.1B则较为分散;因此,图9.1A中X和Y相关的密切程度必高于图9.1B。③图9.1C中X和Y的关系是非直线型的;大约在x≤(6—7)时,Y随X
6、的增大而增大,而当x>(6—7)时,Y随X的增大而减小。x,生物产量(g)水稻单株生物产量与稻谷产量的散点图x,每m2颖花数(万)水稻每m2颖花数和结实率的散点图x,最高叶面积指数水稻最高叶面积指数和亩产量的散点图第二节直线回归一、直线回归方程二、直线回归的假设测验和区间估计三、直线回归的矩阵求解一、直线回归方程(一)直线回归方程式(9·1)回归截距(regressionintercept):a是x=0时的值,即回归直线在y轴上的截距。回归系数(regressioncoefficient):b是x每增加一个单位数时,平均地
7、将要增加(b>0时)或减少(b<0时)的单位数。时,分别对a和b求偏导数并令其为0,可得正规方程组(normalequations):得(9·2)(9·3)(9·4)将(9·2)代入(9·1)可得:y①②③①a>0,b<0②a>0,b>0③a<0,b>0x直线回归方程的图象由(9·4)可看到:①当x以离均差(x-)为单位时,回归直线的位置仅决定于和b;②当将坐标轴平移到以(,)为原点时,回归直线的走向仅决定于b,所以一般又称b为回归斜率(regressionslope)。(二)直线回归方程的计算[例9.1]一些夏季害虫盛
8、发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬·度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于表9.1。试计算其直线回归方程。首先由表9.1算得回归分析所必须的6个一级数据(即由观察值直接算得的数据):x累积温y盛发期35.534.131
此文档下载收益归作者所有