资源描述:
《非参数回归模型与半参数回归模型》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第七章非参数回归模型与半参数回归模型第一节非参数回归与权函数法一、非参数回归概念前面介绍的回归模型,无论是线性回归还是非线性回归,其回归函数形式都是已知的,只是其中参数待定,所以可称为参数回归。参数回归的最大优点是回归结果可以外延,但其缺点也不可忽视,就是回归形式一旦固定,就比较呆板,往往拟合效果较差。另一类回归,非参数回归,则与参数回归正好相反。它的回归函数形式是不确定的,其结果外延困难,但拟合效果却比较好。设Y是一维观测随机向量,X是m维随机自变量。在第四章我们曾引进过条件期望作回归函数,即称g(X)=E(Y
2、X)(7.1.1)为
3、Y对X的回归函数。我们证明了这样的回归函数可使误差平方和最小,即(7.1.2)这里L是关于X的一切函数类。当然,如果限定L是线性函数类,那么g(X)就是线性回归函数了。
细心的读者会在这里立即提出一个问题。既然对拟合函数类L(X)没有任何限制,那么可以使误差平方和等于0。实际上,你只要作一条折线(曲面)通过所有观测点(Yi,Xi)就可以了是的,对拟合函数类不作任何限制是完全没有意义的。正象世界上没有绝对的自由一样,我们实际上从来就没有说放弃对L(X)的一切限制。在下面要研究的具体非参数回归方法,不管是核函数法,最近邻法,样条法,小波法
4、,实际都有参数选择问题(比如窗宽选择,平滑参数选择)。所以我们知道,参数回归与非参数回归的区分是相对的。用一个多项式去拟合(Yi,Xi),属于参数回归;用多个低次多项式去分段拟合(Yi,Xi),叫样条回归,属于非参数回归。二、权函数方法非参数回归的基本方法有核函数法,最近邻函数法,样条函数法,小波函数法。这些方法尽管起源不一样,数学形式相距甚远,但都可以视为关于Yi的线性组合的某种权函数。也就是说,回归函数g(X)的估计gn(X)总可以表为下述形式:(7.1.3)92其中{Wi(X)}称为权函数。这个表达式表明,gn(X)总是Yi的线
5、性组合,一个Yi对应个Wi。不过Wi与Xi倒没有对应关系,Wi如何生成,也许不仅与Xi有关,而且可能与全体的{Xi}或部分的{Xi}有关,要视具体函数而定,所以Wi(X)写得更仔细一点应该是Wi(X;X1,…,Xn)。这个权函数形式实际也包括了线性回归。如果,则,也是Yi的线性组合。在一般实际问题中,权函数都满足下述条件:(7.1.4)如果考虑在第五章介绍的配方回归与评估模型曾有类似条件,不妨称之为配方条件,并称满足配方条件的权函数为概率权。下面我们结合具体回归函数看权函数的具体形式。
1.核函数法选定Rm空间上的核函数K,一般取概率
6、密度。如果取正交多项式则可能不满足配方条件。然后令(7.1.5)显然。此时回归函数就是(7.1.6)2.最近邻函数法首先引进一个距离函数,用来衡量Rm空间中两点u=(u1,…,um)和v=(v1,…,vm)的距离‖u-v‖。可以选欧氏距离,也可以选。为了反映各分量的重要程度,可以引进权因子C1,…,Cn,使{Ci}也满足配方条件。然后将距离函数改进为(7.1.7)(7.1.8)92现在设有了样本(Yi,Xi),i=1,…,n,并指定空间中之任一点X,我们来估计回归函数在该点的值g(X)。将X1,…,Xn按在所选距离‖·‖意义下与X接近
7、的程度排序:
(7.1.9)这表示点与X距离最近,就赋以权函数k1;与X距离次近的就赋予权函数k2。…,等等。这里的n个权函数k1,…,kn也满足配方条件,并且按从大到小排序,即(7.1.10)就是(7.1.11)若在{‖Xi-X‖,i=1,…,n}中有相等的,可将这n个相等的应该赋有的权取平均。比如若前两名相等,‖X1-X‖=‖X2-X‖,就令W1=W2=。这样最近邻回归函数就是(7.1.12)ki尽管是n个常数,事先已选好,但到底排列次序如何与X有关,故可记为ki(X)。
三、权函数估计的矩相合性
首先解释矩相合性的概念。如果对样
8、本(Yi,Xi),i=1,…,n构造了权函数Wi=Wi(X)=WI(X;X1,…,Xn),有了回归函数g(X)的权函数估计,当Y的r阶矩存在(E
9、Y
10、r<∞)时,若(7.1.13)则称这样的权函数为矩相合的权函数。在什么样的条件下构造的权函数是矩相合的呢?Stone(1977)提出了很一般的,几乎是充分必要的条件。下面我们考虑其充分性条件,并限于考虑概率权。定理7.1.1设概率权{Wi}满足下述条件:(1)存在有限常数C,使对Rm上任何非负可测函数(连续函数与分段连续函数是最常见的可测函数)f,必有(7.1.14)92(2)ε>0,当
11、n→∞时,(7.1.15)(3)当n→∞时,(7.1.16)则{Wi}是矩相合的权函数。定理条件可以作一些直观解释。条件(1)可以作如下理解,因为权函数是概率权,必有
12、Wi
13、<1,i=1,…,n。于是(7.1.17)这里