欢迎来到天天文库
浏览记录
ID:57171678
大小:2.07 MB
页数:76页
时间:2020-08-02
《简单线性相关与回归课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、简单线性相关与回归2012年11月29日大理学院巫秀美在医学科学研究中,常常要分析两个变量之间的关系,例如身高和体重、年龄和血压、体温和脉搏、药物剂量和疗效等问题,因此涉及到研究两个变量的相互关系。这时就涉及到两个变量之间的相关(correlation)与回归(regression)。简单线性相关与回归Correlation&Regression相关的意义、概念和种类相关图表、相关系数和相关分析简单线性回归相关分析和回归分析中应注意的问题相关的意义、概念和种类在总体中,如果对变量x的每一个数值,相应
2、还有第二个变量y的数值,则各对变量的变量值所组成的总体称为二元总体;由二个以上相互对应的变量组成的总体,称为多元总体。二元总体中两变量是不是存在关系?关系的密切程度如何?关系的具体形式是什么?怎样根据一个变量的变动来估计另一变量的变动?Correlation相关分析就是对二元总体中确实具有联系的标志进行分析。现象总体的依存关系类型:一个变量取一定值时另一个变量有确定值与之对应,这种变量间一一对应的确定性关系称为函数关系,y=f(x)。一个变量取一定值时,与之对应的另一个变量的值虽然不确定,但它按某种
3、规律在一定范围内变化,这种变量间的不确定性对应关系称为相关关系,y=f(x)+ε(ε为随机变量)。圆的面积与半径;计件工资总额与零件数量;收入水平与受教育程度;看书时间和学习成绩;父亲身高与子女身高。函数关系v.s.相关关系相关关系的种类按相关的因素单相关复相关(多元相关;偏相关)按相关的形式线性相关(直线相关)非线性相关(曲线相关)按相关的方向正相关负相关按相关的程度完全相关不完全相关不相关相关关系的散点图(scatterdiagram)不相关负线性相关
4、正线性相关非线性相关完全负线性相关完全正线性相关相关分析v.s.相关系数相关分析:描述和测度变量间相关关系类型和相关程度的分析方法相关分析的目的:通过相关系数来描述和度量两变量线性联系的程度和方向所有变量都假定是随机变量,不存在解释变量和被解释变量的关系,即不考虑因果关系相关系数:对变量之间关系密切程度的度量;适用于双变量正态分布(BivariateNormalDistribution)资料二元正态分布的概率密度图当时二元正态
5、分布的钟形密度曲如下图。相关分析v.s.相关系数连续变量的相关指标:积差相关系数(Pearson’sCorrelationCoefficient)总体相关系数:样本相关系数:r相关系数的取值在-1与1之间。样本相关系数r不等于零,并不表示总体相关系数不等于零,还要作假设检验(显著性检验)相关系数的计算X和Y的离均差积和X的离均差平方和,令相关系数的特点当r=0时,表明X与Y没有线性相关关系。当时,表明X与Y存在一定的线性相关关系:若r>0表明X与Y为正相关;若r<0表明X与Y为负相关。当时,表明
6、X与Y完全线性相关:若r=1,称X与Y完全正相关;若r=-1,称X与Y完全负相关。相关关系的散点图(scatterdiagram)r=0r<0r>0r=-1r=1统计检验的必要性:r≠0抽样误差?两总体确实存在相关关系?检验的依据:如果x和y都服从正态分布,在总体相关系数ρ=0的假设下,与样本相关系数r有关的t统计量服从自由度为n-2的t分布:相关系数的检验相关系数的假设检验样本相关系数的标准误查t界值表,得
7、P值给定显著性水平,查自由度为n-2的临界值t/2(p.483);若tt/2,表明相关系数r在统计上是显著的,应否定=0而接受0的假设;若tt/2,还不能拒绝=0的假设。例10.1为研究一种饲料的营养价值,观察10只体重相近的大白鼠的进食量与体重增加的关系。(表10-1,p.180)直接查r表:按自由度υ=n–2直接查r界值表(p.499)相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析线性相关中应注意的问题线性相关分析仅适用于二元正
8、态分布资料.进行分析前先绘制散点图.出现异常值(离群值)时慎用相关.样本的相关系数接近零并不意味着两变量间一定无相关性.相关未必真有内在联系或因果关系.分层资料盲目合并易出假象.相关分析应用中应注意的问题图a中有异常值,采用异常点似有相关性;图b两个无线性关系的分层资料,合并后似有相关性;图c两个分层资料原来均有相关性,合并后似无相关性;图d两个分层资料原来均有正相关,合并后似变为负相关。适用条件:①资料不服从双变量正态分布不宜作积差相关分析;②总体分布型未知,一端
此文档下载收益归作者所有