《直线回归与相关》PPT课件

《直线回归与相关》PPT课件

ID:39644414

大小:580.60 KB

页数:53页

时间:2019-07-08

《直线回归与相关》PPT课件_第1页
《直线回归与相关》PPT课件_第2页
《直线回归与相关》PPT课件_第3页
《直线回归与相关》PPT课件_第4页
《直线回归与相关》PPT课件_第5页
资源描述:

《《直线回归与相关》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、直线相关与回归主讲教师熊伟1教学大纲了解最小二乘法原理,回归系数、相关系数的计算,直线回归方程的应用。掌握直线回归、直线相关的概念,回归系数、相关系数的意义及其假设检验方法。重点是回归系数、相关系数的意义。难点是直线回归与直线相关的区别和联系。2复习已学过的基本统计推断方法:t检验、u检验、2检验、秩和检验请思考:以上的统计方法研究了几个变量?(在确定的总体之后,研究者则应对每个研究单位的某项特征进行测量和观察,这种特征称为变量)31986年某市抽样调查了市区309名16岁健康男孩的身高。均数162.28厘米,标准差6.39

2、厘米,该人群身高呈正态分布。1976年该市16岁男孩身高的总体均数为161.10厘米,试问1986年该市区16岁男孩身高是否比1976年有所增高?请问此题有几个变量?假如我们要研究16岁健康男孩的身高与体重的关系情况,则有几个变量?4单变量分析(univariateanalysis):t检验、u检验、2检验、秩和检验、方差分析双变量分析(multivariateanalysis):人的身高与体重,体温与脉搏次数,年龄与血压,药剂量与疗效,体表面积与肺活量,身高与臂长5双变量有2种情况两个变量都是随机变量,以X和Y表示。常见的

3、是(X,Y)服从双变量正态分布,即任意X处Y服从正态分布,任意Y处X服从正态分布。比如某个人群的身高和体重之间的关系。一个变量为选定变量,以X表示,其X值为选定的;一个变量是随机变量,以Y表示,其Y值是随机变化的。最常见的是各X处,Y服从正态分布。例如选定变量为年龄X,用1岁作间距,随机变量为各岁处人群的身高Y,则各X处Y服从正态分布。6两个变量间的数量关系就研究目的来说有两种互依关系:两个X和Y变量都为随机变量,研究X和Y的彼此关系或彼此影响,用相关关系。依存关系:一个为自变量,用X表示;一个为应变量,用Y表示。研究X对Y的

4、作用,或Y对X的依赖,用回归分析。7单变量分析身高、体重、体温等各自的分布特征。双变量分析:身高与体重的关系体温与脉搏次数的关系体表面积与肺活量的关系多变量分析:学习成绩与试题难度、IQ、学习态度、缺席情况、上课认真程度等的关系8变量间的相互关系确定性关系:函数关系非确定性关系:相关与回归简单相关与回归多元相关与回归直线相关与回归曲线相关与回归9第一节直线相关(linearcorrelation)10一、直线相关的概念相关:两个(或多个)变量之间存在相互关系及关系紧密程度。直线相关:用来描述具有直线关系的两变量X、Y间的相互关

5、系。11研究直线相关的目的研究两个随机变量X与Y之间的相互关系及其密切程度。12直线相关的适用条件随机变量X与Y必须都服从正态分布1314怎样衡量有无直线相关关系?可见我们得引入新的研究指标,用来判断两变量是否有直线相关以及关系的密切程度。该指标为相关系数15二、相关系数的意义和计算1、相关系数的意义:r的绝对值大小表示两变量之间的关系密切程度。r的范围:-1≤r≤1。当

6、r

7、=1时,为完全相关;当0

8、脑血管疾病的诊断治疗中,脑脊液白细胞介素-6(IL-6)水平是影响诊断与预后分析的一项重要指标,但脑脊液在临床上有时又不容易采集到。某医生欲了解急性脑血管病病人血清与脑脊液IL-6水平,随机抽取了某医院确诊的10例蛛网膜下腔出血(SAH)患者24小时内血清IL-6(pg/ml)和脑脊液IL-6(pg/ml)数据如下,问SAH患者血清IL-6和脑脊液IL-6间是否有直线相关关系存在?SAH患者第一天血清和脑脊液IL-6(mg/ml)检测结果患者号12345678910血清IL-622.451.658.125.165.979.77

9、5.332.496.485.7脑脊液IL-6134.0167.0132.380.2100.0139.1187.297.2192.3199.4193、直线相关分析步骤(1)、绘制散点图观察两变量间是否有直线趋势。2021223、直线相关分析步骤(1)、绘制散点图观察两变量间是否有直线趋势。(2)、计算相关系数:应用计算器或统计软件可以求得。(参见实习六)2324问题:我们能否得出结论说明SAH患者血清IL-6和脑脊液IL-6间是有直线相关,相关系数是0.7232。为什么?25相关系数的假设检验上例中的相关系数r等于0.7232,

10、说明了10例样本中SAH患者血清IL-6和脑脊液IL-6间是有直线相关,但是,这10例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数()为零时,由于抽样误差,从总体抽出的10例,其r可能不等于零。所以,要判断该样本的r是否有意义,需与总体相关系数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。