资源描述:
《a题思路之一多元非线性回归分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、A题思路之一——多元非线性回归分析本题求解关键为建立工资与其他7个因素之间的关系模型,可以考虑采用回归分析法,也可以考虑其他方法;以下仅以回归分析法过程为例给出分析思路,仅供参考:注意:根据下述结果发现本问题应该考虑为多元非线性回归,因此请大家优先挑出使用非线性回归模型的论文,其余酌情考虑。1.数据预处理1)为数据分析方便,应该考虑名义变量或有序变量的量化处理(编码),如可以考虑如下编码方案(含符号约定):-日平均工资的对数,便于回归分析;作为因变量。;:工龄;;;;2)分别作出y与各自变量之间的散点图,发现与x2非线性关系较为明显(下图所示),所以应该考虑为非线性模型,
2、data=xlsread('Adata.xls',2);y=data(:,1);x=data(:,2:8);plot(x(:,2),y,'r*')title('lnyvsx2')3)相关性分析data=xlsread('Adata.xls',2);y=data(:,1);x=data(:,2:8);s=corrcoef(data);xlswrite('coef.xls',s)lnyX1X2X3X4X5X6X710.2669950.7752910.2861350.5055260.2779290.1991780.4897860.26699510.1603890.6794460
3、.3123480.417621-0.104980.3160250.7752910.16038910.2260960.1031460.0988540.1511460.1563210.2861350.6794460.22609610.2669370.213363-0.279660.2295350.5055260.3123480.1031460.26693710.4127450.2197620.8552360.2779290.4176210.0988540.2133630.4127451-0.053070.4233550.199178-0.104980.151146-0.279
4、660.219762-0.0530710.2556650.4897860.3160250.1563210.2295350.8552360.4233550.2556651相关系数表也提示y仅与x2,x4关系密切.与婚姻状况x1,x3关系不明显.2、建模及简易求解(第1、3问)以下考虑分别用多元线性回归模型、线性逐步回归模型、非线性模型分析,从中选择相对最优的模型。1).多元线性回归结果源程序:data=xlsread('Adata.xls',2);Y=data(:,1);x=data(:,2:8);X=[ones(90,1),x];[b,bint,r,rint,stats]
5、=regress(Y,X);b,bint,stats结果:b(系数)=3.6623常数项0.0044x10.0016x2-0.0010x30.1713x40.0170x5-0.0012x60.0143x7Bint(系数95%置信区间)=3.59573.7289-0.08280.09170.00140.0019-0.09300.09100.08490.2577-0.05360.0876-0.07980.0773-0.12540.1540置信区间包含零点,可认为在95%置信度下,相应变量对y影响不显著,应该考虑改进模型。stats(统计量)=0.7852(决定系数)42.83
6、04(F值)0(P值)0.0193关于异常值:利用上述多元线性回归模型分析结果,继续做异常点分析,rcoplot(r,rint)发现5个异常点:4352606190从原始数据中将其剔除后,重新做多元线性回归,源程序:data=xlsread('Adata.xls',4);Y=data(:,1);x=data(:,2:8);X=[ones(85,1),x];[b,bint,r,rint,stats]=regress(Y,X);b,bint,stats结果b=3.65020.00550.0017-0.02820.17520.0188-0.00760.0330bint=3.59
7、493.7055-0.06880.07980.00150.0019-0.10560.04930.10260.2477-0.04060.0782-0.07390.0587-0.08800.1539stats=0.852663.607100.0132可见决定系数与F值均提高!2)线性逐步回归结果(考虑采用逐步回归方法)data=xlsread('Adata.xls',4);y=data(:,1);x=data(:,2:8);stepwise(x,y);系数:beta=00.001700.1926000系数95%置信区间:betac