欢迎来到天天文库
浏览记录
ID:10633351
大小:221.00 KB
页数:117页
时间:2018-07-07
《聚类分析matlab程序 聚类分析 主成分分析和典型相关分析 含matlab程序》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、聚类分析matlab程序聚类分析主成分分析和典型相关分析含matlab程序导读:就爱阅读网友为您分享以下“聚类分析主成分分析和典型相关分析含matlab程序”的资讯,希望对您有所帮助,感谢您对92to.com的支持!∑(yi=1ni?i)+∑(y?i?+2∑(yi?y?i)(y?i??=∑(yi?y222i=1i=1i=1nnnn由于∑(yi=1nni??β?x)(β?+β?x??i)(y?i?=∑(yi?β?y01i01ii=1nn????????=β0∑(yi?β0?β1xi)+β1∑xi(yi?β0?β1xi)?∑(y
2、i?β0?β1xi)=0i=1117ni=1i=1因此,得到正交分解式为记∑(yi=1ni?i?+∑(yi?y?i)2(14)?=∑(y22i=1i=1nnSST=∑(yi?)2,这是原始数据yi的总变异平方和,其自由度为dfT=n?1;?+β?x可解释的变异平方和,其自?i?)2,这是用拟合直线y?i=βSSR=∑(y01ii=1ni=1n由度为dfR=1;?i)2,这是残差平方和,其的自由度为dfE=n?2。SSE=∑(yi?yi=1所以,有SST=SSR+SSE,dfT=dfR+dfE117从上式可以看出,y的变异是由
3、两方面的原因引起的;一是由于x的取值不同,而给y带来的系统性变异;另一个是由除x以外的其它因素的影响。注意到对于一个确定的样本(一组实现的观测值),SST是一个定值。所以,可解释变异SSR越大,则必然有残差SSE越小。这个分解式可同时从两个方面说明拟合方程的优良程度:(1)SSR越大,用回归方程来解释yi变异的部分越大,回归方程对原数据解释得越好;(2)SSE越小,观测值yi绕回归直线越紧密,回归方程对原数据的拟合效果越好。因此,可以定义一个测量标准来说明回归方程对原始数据的拟合程度,这就是所谓的判定系数,有些文献上也称之为
4、拟合优度。判定系数是指可解释的变异占总变异的百分比,用R表示,有2SSRSSE=(1?)(15)SSTSST2117从判定系数的定义看,R有以下简单性质:2(1)0≤R≤1;2(2)当R=1时,有SSR=SST,也就是说,此时原数据的总变异完全可以由拟合值的变异来解释,并且残差为零(SSE=0),即拟合点与原数据完全吻合;2(3)当R=0时,回归方程完全不能解释原数据的总变异,y的变异完全由与xR2=-234-无关的因素引起,这时SSE=SST。测定系数时一个很有趣的指标:一方面它可以从数据变异的角度指出可解释的变异占总变异
5、的百分比,从而说明回归直线拟合的优良程度;另一方面,它还可以从相关性117?的相关程度,从这个角度看,拟合变量y?与原的角度,说明原因变量y与拟合变量y变量y的相关度越大,拟合直线的优良度就越高。看下面的式子?n?2??+??(ye)(y)??(y)i?∑ii?iSSR∑i=1??=r2(y,y2i=1?)(16)=n=nR=nSST?i?2∑(yi?)2∑(yi?)2∑(yni=1i=1i=12在推导中,注意有?∑e(yii=12ni?i?∑ei=0?=∑eiyi=1i=1nn?的相关系数平方。所以,R又等于y与拟合变量y
6、还可以证明,R等于y与自变量x的相关系数,而相关系数的正、负号与回归2117?的符号相同。系数β12.4显著性检验2.4.1回归模型的线性关系检验在拟合回归方程之前,我们曾假设数据总体是符合线性正态误差模型的,也就是说,y与x之间的关系是线性关系,即yi=β0+β1xi+εi,εi~N(0,σ2),i=1,2,L,n2然而,这种假设是否真实,还需进行检验。?的相关程度,对于一个实际观测的样本,虽然可以用判定系数R说明y与y但是,样本测度指标具有一定的随机因素,还不足以肯定y与x的线性关系。假设y与x之间存在线性关系,则总体模
7、型为117yi=β0+β1xi+εi,i=1,2,L,n如果β1≠0,则称这个模型为全模型。用最小二乘法拟合全模型,并求出误差平方和为?i)2SSE=∑(yi?yi=1n现给出假设H0:β1=0。如果H0假设成立,则yi=β0+εi?=0β1?=?β?=β00这个模型被称为选模型。用最小二乘法拟合这个模型,则有因此,对所有的i=1,2,L,n,有-235-?i≡y该拟合模型的误差平方和为∑(yi=1ni?)2=SST因此,有SSE≤SST117这就是说,全模型的误差总是小于(或等于)选模型的误差的。其原因是在全模型中有较多的
8、参数,可以更好地拟合数据。假若在某个实际问题中,全模型的误差并不比选模型的误差小很多的话,这说明H0假设成立,即β1近似于零。因此,差额(SST?SSE)很少时,表明H0成立。若这个差额很大,说明增加了x的线性项后,拟合方程的误差大幅度减少,则应否定H0,认为总体参数β1显著不为零。假设检
此文档下载收益归作者所有