数学建模 相关分析与回归分析 清华大学.ppt

数学建模 相关分析与回归分析 清华大学.ppt

ID:56373648

大小:1008.00 KB

页数:61页

时间:2020-06-14

数学建模 相关分析与回归分析  清华大学.ppt_第1页
数学建模 相关分析与回归分析  清华大学.ppt_第2页
数学建模 相关分析与回归分析  清华大学.ppt_第3页
数学建模 相关分析与回归分析  清华大学.ppt_第4页
数学建模 相关分析与回归分析  清华大学.ppt_第5页
资源描述:

《数学建模 相关分析与回归分析 清华大学.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、第六章相关与回归分析(一)相关关系的概念前面介绍的描述统计量都是对单个变量的特征进行描述,当数据集含有多个变量时,除分别描述每个变量外,描述这些变量之间的关系也是十分重要的,尤其是确定标量之间的线性关系是更为常见。现象之间的相互依存关系1)函数关系——用函数表达式表示一一对应关系。2)相关关系——变量之间确实存在着数量上的关系,但关系值是不确定的。(二)相关关系的种类1)根据依存关系:(1)因果关系:单向因果关系互为因果关系(2)分不清因果的依存关系2)自变量的多少来分(1)单相关:只有一个自变量(2)复相关:有两个及以上的自变量3)形式不同(1)线性相

2、关(直线相关)(2)非线性相关(曲线相关)4)根据相关关系的方向来分(1)正相关:指两个变量之间的变化方向一致,都是增长趋势或下降趋势。(2)负相关:两个变量的变化趋势相反。******r=+1*********r=-1***********************r>0*****************************r<0r=1表示X,Y之间存在线性关系:Y=aX+br>0表示大体上Y随着X增加而递增。r<0表示大体上Y随着X增加而递减。*****************************r0r=0表示Y与X之间没有线性关系(不排斥

3、Y与X之间存在非线性关系)(三)相关分析的步骤相关分析(广义)一方面:研究变量之间关系的密切程度。[相关分析(狭义)]另一方面:研究自变量和因变量之间的变动关系,用数学方程式来表达。(称为回归分析)步骤:1)判断现象之间有无相关关系存在及呈现的形态。(相关表和相关图)2)确定相关关系的密切程度。(计算相关系数)3)对具有相关关系的变量建立数学模型并求解方程参数。4)进行相关性检验。用过程PLOT将这三组变量的数据分别画在直角坐标系里,以便对数据的分布和相关系数的大小有一个直观的了解。PLOTOFMAXPULSE*RUNPULSEPLOTOFOXYGEN*

4、RUNTIMEPLOTOFRSTPULSE*WEIGHT(四)相关系数若为变量X,Y的n个观测值,则相关系数计算公式为:相关系数进行相关程度的判断标准:r在0.3以下,不存在直线相关;r在0.3---0.5之间是低度直线相关;r在0.5---0.8之间是显著相关;r在0.8以上是高度相关;计算出的相关系数是否真的能判断出两个变量之间存在相关关系,可进行线性相关性和显著性检验。方法如下:1)计算自由度f=n-k-1(其中n--样本容量;k--自变量个数)2)选取显著性水平,通常取=0.05或0.013)查表。根据和f,查相关系数临界值表4)判断。当时

5、,则x与y之间显著线性相关。银行雇员数据,分析的目的是要观察起始工资(salbegin)和现工资(salary)与雇员本人各方面条件的关系。变量有:salary(当前工资)、age(年龄)、jobtime(工作时间)、prevexp(以前工作经验)。职务等级输出结果:1、现在工资平均值比起始工资高。2、现工资差别大。安徽省国民收入与城乡居民存款余额数据。问:余额与收入之间线性关系?例:某地区1985—1996年人均月收入和商品销售额资料如下,计算相关系数并检验。年份人均月收入商品销售额x2y2xy19854802202304004840010560019

6、8656028031360078400156800198760030036000090000180000198861032037210010240019520019896203303844001089002046001990650335422500112225217750199167034044890011560022780019927003524900001239042464001993750380562500144400285000199478040060840016000031200019958204056724001640253321001996

7、850425722500180625361250合计80904087558770014288792824500根据公式:=0.985取=0.05,f=n-1-1=12-2=10,得r0.05(10)=0.5760由于r>r0.05(10)=0.5760,所以x与y之间存在线性关系且关系显著。模块BASE中的过程CORR可方便地用于计算变量之间的相互关系:计算数据集FITNESS中OXYGEN,MAXPULSE,RSTPULSE三个变量和另三个变量RUNTIME,RUNPULSE,WEIGHT之间的相关系数。以下可看出变量MAXPULSE和RUNPULS

8、E有最大的正相关,OXYGEN和RUNTIME负相关的绝对值最大,RSTPLUS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。