直线回归与相关分析

直线回归与相关分析

ID:39596072

大小:1.35 MB

页数:46页

时间:2019-07-06

直线回归与相关分析_第1页
直线回归与相关分析_第2页
直线回归与相关分析_第3页
直线回归与相关分析_第4页
直线回归与相关分析_第5页
资源描述:

《直线回归与相关分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、直线相关与回归分析两变量或多变量之间的关系,总起来可分为两类,一类是函数关系,确定关系的例子,在生物界中是极少见的。生物中,大量存在的情况是:一种变量受另一种变量的影响,两者之间既有关系,但又不存在完全确定的函数关系。知道其中一种变量,并不能精确求出另一变量。下面请同学们举几个例子。单位面积的施肥量、播种量和产量三者之间的关系。树木胸径与树木高度的关系。人类血压与年龄的关系。玉米的穗长与穗重的关系。人的身高与体重的关系。身高与胸围、体重溶液的浓度与OD值人类的年龄与血压温度与幼虫孵化相关关系:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它

2、仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系生物学中,研究两变量间的关系,主要是为了探求两变量的内在联系,或者是从一个变量X去推测另一个随机变量Y.例如,我们希望通过施肥量X去推测Y如果对于变量X的每一个可能的值xi,都有随机变量Y的一个yi与之对应,则称随机变量Y对变量X存在回归关系。为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的,然后在直角坐标系上描述这些点,这一组点集称为散点图。为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代

3、表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。散点图(scatterdiagram)两个变量间关系的性质(正向协同变化或负向协同变化)和程度(关系是否密切)两个变量间关系的类型(直线型或曲线型)是否有异常观测值的干扰123456432112345643211234564321正向直线关系负向直线关系曲线关系定性研究第一节:回归与相关的概念相关变量因果关系互依关系回归分析(regressionanalysis)相关分析(correlationanalysis)一个变量

4、的变化受另一个变量或几个变量的制约两个以上变量之间共同受到另外因素的影响xy施肥量(可以严格地人为控制)产量如果对x的每一个可能的值,都有随机变量y的一个分布相对应,则称随机变量y对变量x存在回归(regression)关系。自变量(independentvariable)因变量(dependentvariable)因果关系一个变量的变化受另一个变量或几个变量的制约在大量测量各种身高人群的体重时会发现,虽然在同样身高下,体重并不完全一样。但在每一身高下,都有一个确定的体重分布与之相对应;在大量测量各种体重人群的身高时会发现,虽然在同样体重下,身高并不完全一样。但在每一体重下

5、,都有一个确定的身高分布与之相对应;身高与体重之间存在相关关系。X身高Y体重X体重Y身高相关关系例:土壤内NaCl含量对植物的生长有很大影响,NaCl含量过高,将增加组织内无机盐的累积,抑制植物生长。下表中的数据是每1000g土壤中所含NaCl的不同克数(X),对植物单位叶面积干物重的影响。NaCl含量X(g/kg)00.81.62.43.24.04.8干重Y(mg/dm2)809095115130115135不同NaCl含量对单位叶面积干物重的影响一、直线回归方程的建立第二节:直线回归LinearRegression散点图如下我们描绘散点的目的:(1)两变量之间的关系是否

6、密切,能否用X来估计Y;(2)两变量之间的关系是呈线性或某种曲线;(3)是否存在某个点偏离过大;(4)是否存在其他规律。变量1变量2收集数据散点图温度天数X平均温度(℃)Y历期天数(d)11.830.114.717.315.616.716.813.617.111.918.810.719.58.320.46.7例:黏虫孵化历期平均温度与历期天数黏虫孵化历期平均温度与历期天数关系图01020304010121416182022温度天数(天)(℃)若我们增加每一NaCl浓度下的观测次数,其散点图如下:(可见其平均值更趋近于一条直线)平均数有一个特性,即在各种离差平方和中,以距平均

7、数的离差平方和最小。我们把观测值与回归估计值之间的离差平方和最小时的回归线作为最好的回归线。其方法为最小二乘法而回归直线是指所有直线中最接近散点图中全部散点的直线。设样本直线回归方程为:回归直线在平面坐标系中的位置取决于a,b的取值。y最小最小二乘法(methodofleastsquare)01020304010121416182022温度天数(天)(℃)11.8-----20.4用x估计y,存在随机误差,必须根据回归的数学模型对随机误差进行估计,并对回归方程进行检验。Y=a+bx^直线回归方程(linearreg

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。