回归概念的起源

回归概念的起源

ID:30803238

大小:181.50 KB

页数:4页

时间:2019-01-03

回归概念的起源_第1页
回归概念的起源_第2页
回归概念的起源_第3页
回归概念的起源_第4页
资源描述:

《回归概念的起源》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、“回归”的概念是英国科学家F.高尔顿爵士(Sir.FrancisGallon,1822〜1911)提出來的。高尔顿是达尔文的表弟-最初因读《物种起源》而深受震动,遂研究起人的特质遗传问题,后來乂接受达尔文的建议,繁育甜豌豆(sweatbean)来继续遗传研究。经过一轮精心繁育,在对收获的豆子作了粕心研究后,高尔顿写了"遗传的典型法则”(TypicalLawsofHeredity)一文,文中一组关键数据如下表。表:亲代与子代各组豆粒的直径(1/100英寸)豌豆组组1组2组3组4组5组6组7亲代的15.016.017.018.019.020.021.0了代

2、的15.415.716.016.316.617.017.3表中列有7组豆。亲代各组豆粒的直径极有规则地变化,反映了高尔顿挑选豆种的精心程度。更重耍的是,虽然子代各组豆粒的直径不同也有规则,但是组间极差(17.3-15.4=1.9)小于亲代的(21.0-15.0=6.0),好像“收缩”了,这是亲代豆粒的直径每增加1.0单位时,了代豆粒的直径仅增加1/3单位的表现。高尔顿把这种现象称作向平均化的亲代“冋复”(revertiny)。不过高尔顿真正关心的是人的特质的遗传问题,因此颇怀疑豌豆的资料能否对此有所说明。由于当时得不到一家两代人的测量数据样本,高尔顿只

3、好等待,等了8年;最后,他还是通过悬赏才征集到关于家庭成员特征的一批数据。基于这些数据,他写了几篇论文,在其中一篇代表性的论文中,高尔顿以T叫归”(regression)—词取代了“冋复”,并图示了子女身高向父-母身高的平均数回归的趋势如下图:具体地说,两人是同一个祖父而不同的祖母。图:了女身高向父•母身高平均数回归的高尔顿图上图的表现方式比较老,解读不方便,我们把它简约成下面的图。图中的横坐标X表示父■母啲身高,纵坐标Y表示成年了女的身高,具体的测量值经过“标准化”(standardized)而转换成标准分数Z,平均数上和V都为0,单位是标准差(St

4、andardDeviation,S)2o我们川“父•母”表示父亲和母亲的平均。_标准分数Z的逻辑是观测值减平均值后除以标准差,公式是Z=(Xj-X)/SosssosS321►J2十++T---Y子女的身高-3S-2S-IS0+fS+2S+3S个•x:父母的身高图:子女身高向父-母身高平均数回归的示意。图中画出正方形格子,明确表示X、Y的单位都是标准差S。我们看图中的两条斜直线,暂不论其间的差別,则易见它们表达同样的趋势,即父■母长得高,其子女的个子也高。要言之,子女的身高随父■母的身高而相应地变化。然而这是怎样的“相应变化”呢?假定父-母A比父-母B高

5、1S,即在X轴上右移1格,是否子女A也比子女B高1S,即在Y轴上上升1格呢?如果是这样,那就画出虚线,它经过图中任何大小的方格时都表现为对角线。可是实际上,子女身高的“相应变化”如实线所示。我们按图解读:假如父■母B的身高恰在平均值,即XB=X=()S,而父■母A比B高2个单位,即Xa-Xb=2S-0S=2S,亦即右移2格,则实线表明了女A仅比了女B高1S,即丫八-Yb=1S-0S=1S,亦即上移1格,这相对于父-母A來说,就好比“退回”了1格;类似地,假如父■母C比父■母B矮2个单位,即XC-XB=(-2S)-0S=(-2S),亦即左移2格,则实线刻

6、画子女C不是“相应”地比子女B矮2S,而是仅矮IS,Yc-Yb=(-IS)-OS=(-IS),亦即下移1格,这相对于父■母C來说,同样是“退回”了1格。形象地说,似乎子女A和C的身高都“嫌”各白父母的身高“走”得离平均数X“太远”似的,因此都向自己的平均数P“回归”一些。这就是高尔顿说的“回归”的含义。顺便说一下,如果我们在X轴上截取一段区间,比如・2S〜2S,再比较区间内的两条在线,就可以看出如图的实线短于虚线,这又体现了表1.1中子代豆粒肓径极差的“回复”Z义。高尔顿之所以去繁育豌豆,主要原因是不满足于他前期的遗传研究所采用的质的评估法(quali

7、tativeassessment),而想开展数量研究;可是他对研究“人”的执着,却使他静不下心来繁育更多的豌豆,这迟滞了他的研究进展;不过他后来获得的这个关于人的亲子身高数据样本可以实现他的研究目标。因此在确定了子女身高的“回归”现象后,接着要回答的问题是:回归的“量”是多少?依据我们模拟的上图,虚线的“回归量”是Y/X=l/l=2/2=3/3=-=1.0,这实际上是“无所回归”的情况;实线的“回归量”是Y/X=O.5/1=1/2=1.5/3=2/4=-=0.5,这是“有所回归”的情况。要言之,我们可以把Y/X的结果看作“回归系数”,虚线的1.0;实线

8、的是0.5。1885年,高尔顿在研究子女身高与其父母身高的关系吋,第一次采用了“回归”这个词,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。