欢迎来到天天文库
浏览记录
ID:44645694
大小:794.56 KB
页数:35页
时间:2019-10-24
《第10章_回归分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第10章回归分析摘要:回归分析依自变量个数的多少可分为一元回归和多元回归;根据依变量和自变量Z间的关系和性质可分为线性回归和非线性回归。§10.1回归分析概述回归分析的任务和种类1.回归分析解决哪些问题当人们从一组对象上获得2个或多个指标的观测值时,往往需要回答下述几个问题:①如何实现预测,即如何由:1个或多个指标(自变量)的值去推算另1个或多个指标(因变量)的值;②如何实现控制,即事先给出产品质量应达到的标准(因变量的取值范围),根据变量之间的数量关系去控制那些影响产品质量的因素(自变量)的变化区间;③如何实现修匀,由于所研究的
2、指标带有变异性,当川散布图将变量之间的关系呈现出来时,散点所形成的轨迹并非像数学中初等函数那样有规律,需要用合适的数学方法(如用直线或某种光滑曲线)对资料进行修匀,使变量Z间木质联系更清楚地呈现出來。回归分析正是回答上述问题的一种最常用最有效的统计分析方法之一。2.回归分析的种类如果因变量是连续变量(即一般定量资料),设自变量的个数为K,当k=l时,回归分析的种类有:①直线回归分析;②通过百线化实现的简单曲线回归分析(以下简称为曲线拟合);③非线性Illi线拟合;④一般多项式曲线拟合;⑤正交多项式崩线拟合。当kM2时,称为多元回归
3、分析(注:前面的④、⑤两种情况实质上是用多元冋归分析解决只含:个口变量吋较复杂的曲线拟合问题)。当同时对多个因变量进行
4、叫归分析时,称之为多重冋归分析。在多元回归分析屮,简单而乂实用的则是多元线性回归分析(其中某些自变量可以是原观测指标经过某种初等变换的结果,如对数变换、开平方根变换等,因为这里所说的线性是指:函数f(X)相对于回归参数是线性的,并非相对于自变量而如果因变量是与生存时间有关的连续变量且未被离散化(如:生存时间、复发时间、死亡时间等),而白变量可以是定量的,也可以是定性的。此时需用牛存分析中的半参数或参数冋归分析方法
5、。如果因变量是冇序变量,无论它取2个离散值(如:死与活、复发与未复发等)还是多个离散值(白变量可以是定性和定量的)时,都可选用logistic回归分析;如呆把列联表中每个格内的理论频数的对数当作因变量,把分组变量(包含影响因素和观测结果变量两类)当作自变量,可用对数线性模型分析。在口变量代表时间的情况下,通常不假定因变量Y的各次观察值独立,而具有某种非独立的结构,例如构成一平稳序列。这种回归模型的研究被划入统计学的另一个重要分支——时问序列统计分析的范围。二、直线回归与相关分析的概念和要点1・两种分析方法的异同点研究在专业上冇一定
6、联系的两个变量Z间是否存在直线关系以及如何求得直线回归方程等问题,需进行直线相关和回归分析。从研究的目的来说,若仅仅为了了解两变量之间呈直线关系的密切程度和方向,宜选用线性相关分析;若仅仅为了建立由自变虽推算因变量的直线回归方程,宜选用直线回归分析。从资料所具备的条件来说,作相关分析时要求两变量都是随机变最(如:人的身高与体重、血硒与发硒);作回归分析时要求因变量是随机变量,自变量可以是随机的,也可以是一般变量(即可以事先指定变量的取值,如:用药的剂量)。2.散布图在这两种分析中的作用功能齐全的统计软件,会蒙骗盲目运用统计方法的人
7、,进行直线相关和回归分析时,尤其耍注意。因为统计方法只能帮助人们揭示数据Z间内在的统计规律性,而不能创造规律,也就是说,资料Z间是否存在木质联系要靠专业知识來解释。另外,在专业上有一定联系的2项指标Z间的关系并非都是直线关系。实事上,如果2项指标之间呈一条弯曲度不人的“S”型或反“S”型曲线趋势,错误地用一条玄线冋归方程來描述,在统计学上往往会得到较高的显著性,即该直线冋归方程是成立的,但在生物学上是解释不通的(当因变量是某种率时最易发生这种现象)。正确的做法是:将(X,Y)的n对数值绘在直角坐标系内,得到X与Y变化趋势的散布图,
8、如果n个点形成的散布图呈一•条明显的Illi线趋势时,宜拟合一条Illi线回归方程;如果n个点在一条不太宽的长带内随机地分布着,且不存在明显的曲线趋势,可考虑进行直线相关和回归分析;如果n个点形成的散布图近似于一个圆盘,则说明X-UYZ间无确定的变化趋势,几乎是互相独立的,不必硬把它们捏合在一起分析。§10.2一般线性回归分析过程REGREG过程是进行--般线性回归分析通用的过程,该过程釆用最小二乘法拟合线性模型,可以有多个模型(MODEL)语句,输入数据可以是原始样本数据,也可以是相关阵,可输出有关数据的描述统计量、参数估计值、
9、预测值、残差、迸信区间等,并可作线性假设测验,这些统计结果可输出到一个新的SAS数据集屮。一、过程格式PROCREG选择项;Label:MODEL依变量表=自变量表/选择项;BY变量表;FREQ变量;WEIGHT变量;ID变量;VAR变量表;OUT
此文档下载收益归作者所有