直线相关与回归ppt课件.ppt

直线相关与回归ppt课件.ppt

ID:59467778

大小:432.50 KB

页数:47页

时间:2020-09-14

直线相关与回归ppt课件.ppt_第1页
直线相关与回归ppt课件.ppt_第2页
直线相关与回归ppt课件.ppt_第3页
直线相关与回归ppt课件.ppt_第4页
直线相关与回归ppt课件.ppt_第5页
资源描述:

《直线相关与回归ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、直线相关与回归相关与回归的概念经典相关分析要求X与Y都是随机变量,而且服从双变量正态分布。相关关系的统计量使人们对变量间的相关关系是否成立、相关的性质和强弱等有了量化依据。它采用严格的数学计算和概率分布理论使得经典哲学中对事物间的“相关”的定性判断和解释有了定量的前提,也就是说,它使得定性判断以定量分析为基础,因而使前者具有更高的客观性和精确性。回归分析则是试图在变量间建立一种数学公式化的理想模型,通过这个模型,我们可以用一个(组)变量来估计或预测另一个(组)变量的取值,即寻求反应变量对于因变量间依存比例的数量。直线相关分析二维散点图作为相关分析最直观的表

2、达形式莫过于用两变量值绘制的散点分布图数据表达格式实例为探讨产妇尿液中雌三醇含量与初生儿体重是否有关,以便尽早根据产妇产前尿中雌三醇含量水平估计胎儿是否超重,并判断生产过程的风险,某产科医师测量了31例待产妇24小时的尿雌三醇及其初生儿体重,数据记录如下表。散点图相关分析的基本思想相关系数r的算法相关系数的计算相关系数计算的基本统计量相关系数的计算相关系数总体相关系数的显著性检验样本只是总体的一个随机代表,由于抽样误差不可避免,样本相关系数r并非恰好等于总体的相关系数,或者说即使总体相关系数=0,样本相关系数r也不恰好等于0,因此,样本相关系数r必须接

3、受“是否来自总体相关系数=0”的假设检验。相关系数的显著性检验需要对样本相关系数r的抽样误差进行估计,确定其发生的概率,从而在一定的概率水平上对=0的假设作出推断。假设检验的目的也是为了对样本所代表的总体相关系数是否为0作出概率推断。直接查r的界值表;t检验法t检验法检验的统计量自由度v=n–2本例总体相关系数的可信区间估计首先对样本相关系数r进行以下函数变换按正态近似的原理,1-的可信区间最后对此区间的上下限取tanh-1的反函数tanh,就可以得到总体相关系数的1-可信区间,即可信区间估计本例总体相关系数的95%置信区间为:0.6009~0

4、.6186秩相关适用条件:①资料不服从双变量正态分布而不宜作积差相关分析;②总体分布型未知,一端或两端是不确定数值(如<10岁,≥65岁)的资料;③原始数据用等级表示的资料。一、Spearman秩相关1.意义:等级相关系数rs用来说明两个变量间直线相关关系的密切程度与相关方向。2.计算公式例11-4某地研究2~7岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表11-2,试用秩相关进行分析表11-2急性白血病患儿的血小板(109/L)和出血症状利用表11-2中的数据容易算得秩相关系数为负,说明两变量间有负相关关系,同样由样本算得的秩相关系数是否

5、有统计学意义,也应做检验秩相关系数的统计推断检验步骤假设检验统计推断当时,可查书后的临界值表,若秩相关系数超过临界值,则拒绝;当时,也可采用公式(11-5)或(11-6)式做检验例11-5对例1-4的秩相关系数作假设检验例11-4中算得查临界值表,,按的水准,不能拒绝,可以认为急性白血病患儿的出血症状与血小板数之间无相关关系应用相关系数时应注意的问题相关关系不等于因果关系。两变量之间相关系数有统计学意义,只是从统计学上反映出它们之间的变化存在某种规律性,不能直接把这种相关性解释为因果关系。有无因果关系的结论还须从专业角度作进一步的研究。当观察例数较少,例如

6、n<15时,相关系数容易受个别观察对象的特殊值所影响,故不够稳定。有时甚至个别特殊值的存在与否,能改变相关系数的统计学检验结论。因此须事先作好试验设计,正确确定样本含量。在实际工作中,应区别相关有统计学意义与相关强度。相关具有统计学意义指该样本相关系数r来自相关系数=0的总体的概率很小。而相关强度表示两变量间相互联系的密切程度,其大小是用r的绝对值来反映的。简单线性回归分析回归的一般概念回归概念的提出表明我们可以用理想化的数学函数关系来解释因变量y与自变量x在数量变化方面的相互数量比例依存关系,因而可以用自变量x的变化来预测因变量y的取值,这是回归分析的

7、数理逻辑基础。回归分析的目的用已知或易测或可测的变量对未知或难测或不可测变量的状态进行估计。直线回归的统计模型直线回归分析的核心任务是建立两个连续型变量间最优化的直线回归模型,从而采用x对y进行估计或预测。其统计模型可表述为:用样本数据获得该数学模型的估计称为回归方程,即:线性回归模型的含义每个观测的y值都可以分解成三个部分:常量α(constant):即回归直线在纵坐标上的截距(intercept),它是y的本底水平,即x对y没有任何作用时,y的数量表现。回归部分βx:它刻画了因变量y的取值改变中,由y与自变量x的线性相关关系所引起的部分,即可以由x直接

8、估计的部分。其中,x是自变量的取值。β称为回归系数(coeffic

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。