资源描述:
《方差分析相关与回归》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、方差分析简答:1、方差分析处理的是什么样的问题?2、方差分析的原假设和备择假设是怎么做的?3、方差分析在技术上是如何操作的?4、方差分析对数据的前提要求包括哪些?计算:4名驾驶员检测三个路段分别于交通高峰期和非高峰期的通过时间数据如下,请据此进行有交互作用的双因素方差分析:高峰期非高峰期路段115,18,14,2517,13,16,10路段225,31,28,2018,16,19,19路段336,39,30,3129,27,30,2615,18,14,25(18)17,13,16,10(14)1625,31,28,20(26)18,16,19,
2、19(18)2236,39,30,31(34)27,29,30,26(28)31262023相关与回归简答:1、常用的相关系数有哪些,有何区别和联系?2、相关的种类有哪些?3、详细介绍一下Pearson相关系数的意义和使用。4、线性回归方程的拟合原则是怎样的?5、评价拟合优度的指标有哪些?各自如何构造,有何优劣?6、为什么在拟合优度评价之余,仍需要对方程进行检验?7、对线性回归方程的检验包括哪两种?计算:测得12对父子身高数据如下,测度其相关性,拟合子代身高对父代身高的一元线性回归方程,并评价方程的拟合效果(给定显著性水平0.05)父高X子高y
3、父高X子高y646770686366666566676871656667676970696862667170方差分析简答:1、方差分析本质上处理的是定性数据和定量数据之间是否存在关联的问题,但这种关联稍有别于相关,是具有方向性的——考察定性数据是否影响定量数据的变化。2、原假设为假定每一个组所在总体的平均数都是相同的;备择假设是假定其中至少有一个总体的平均数与别组不同。3、方差分析中依据定性数据对定量数据分组,将每一个组视为取自独立总体的样本,依据样本数据表现,判断各组总体平均数是否一致。依据用方差表述的各组数据变动比值构造F分布。4、要求数据
4、组间独立、组内独立、正态分布,组间方差齐性。计算:15,18,14,25(18)17,13,16,10(14)1625,31,28,20(26)18,16,19,19(18)2236,39,30,31(34)27,29,30,26(28)31262023SSdfMSFsig列216121616.20.0000行912245634.20.0000交互16280.60.355随机2401813.33——总和138423———SST=SSC+SSR+SSRC+SSE自由度:nmr-1=23自由度:-1=1自由度:m--2自由度:(n-l)(/n-l
5、)=2自由度:-18w=3]=牛=总方差:SST=工工工(切")=384;”=2加=3厂=4二列方差:SSC二工工工(玄—1)2二216行方差:兰=?m=3]=电=/=!7=1k=川=2m=3厂=4=交互方差:SS/?C=Y工工氏-玄-£+1)2二161=1;=1&=1?:=2J=3r=4随机方差:SSE=)2二240(1)列因素检验仏:他=“2F=MSC/MSE=216/13.33=16.2>Fa/ln_^r_X}=F0025JJ8=5.98拒绝原假设,认为高峰时段和非高峰时段的通行时间存在显著差异。(2)行因素检验Ho:“;=“2=“3F
6、=MSR/MSE=456/13.33=34.2>F如+”(…)=F0.()25>2J8=4.56拒绝原假设,认为各路段通行时间存在显著差异。(3)交互作用检验H():不存在交互作用F=MSRC/MSE=8/13.33=0.6<你必“七心)冲心)==4-56凭此样本不能拒绝原假设,不能认为时段和路段之间存在交互作用。相关与回归简答:1比较常用的相关系数有三种,包括Pearson线性相关系数、Spearman等级相关系数和KendaII等级相关。其中Pearson相关系数是对数据间线性相关的程度所做的度量;Spearman和Kendall相关都属于
7、秩相关,是将数值型数据转换成定序数据后进行的相关计算,这种处理方式虽然首先降低了数据等级,但其结果表示的相关则不仅仅局限于线性关系。2、相关依据形式分为线性的和非线性的;依据方向分为正相关和负相关;依据强度,也可以分为强弱相关,但对这种强弱的程度并没有严格度量。3、Pearson相关系数由其构造方式决定,取值范围在T至1之间,它只能用于描述数据间的线性相关,当系数值趋近于1时,可能表示数据间存在较强的正线性相关,趋于T时则表述可能存在较强负线性相关;无论从哪个方向趋近于0,都表示线性相关程度可能较低。之所以说可能,是因为按照Pearson相关系
8、数的计算,其结果除受到数据间线性相关程度的影响外,数据容量也会影响其取值一—小容量的数据容易表现出较高的系数,而大容量情况下,即使数据本身具有高度线性