多元回归分析肺吸虫囊蚴脱囊影响因素中有关异常点的探讨论文

多元回归分析肺吸虫囊蚴脱囊影响因素中有关异常点的探讨论文

ID:25240072

大小:49.50 KB

页数:4页

时间:2018-11-19

多元回归分析肺吸虫囊蚴脱囊影响因素中有关异常点的探讨论文_第1页
多元回归分析肺吸虫囊蚴脱囊影响因素中有关异常点的探讨论文_第2页
多元回归分析肺吸虫囊蚴脱囊影响因素中有关异常点的探讨论文_第3页
多元回归分析肺吸虫囊蚴脱囊影响因素中有关异常点的探讨论文_第4页
资源描述:

《多元回归分析肺吸虫囊蚴脱囊影响因素中有关异常点的探讨论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、多元回归分析肺吸虫囊蚴脱囊影响因素中有关异常点的探讨论文曲桂玉陈景武杜国防【摘要】目的:探讨准确发现、合理处理实验资料中异常点,资料满足多元线性回归分析条件,确保分析结果真实可靠。方法:采用残差图、残差分析、影响分析、稳健回归及根据专业知识判断。结果:第一组资料所对应的点为异常点,删去异常点,最小二乘法建立的方程与稳健回归建立的方程一致。结论:多种方法结合判断异常点,进一步提高了专业结论的科学性。【关键词】异常点;多元回归分析;稳健回归为了研究肺吸虫囊蚴脱囊的影响因素,我们进行了正交试验并对其试验资料进行多元线性

2、回归分析,旨在建立多元线性回归模型.freel,c)=(i)-)M((i)-)c通常Di1就认为第i组数据是一个强影响点。而在实际中,当Di0.8或Di0.6(当其余的Di较小)时就是一个强影响点[3]。本研究中第一组数据Cook’D为0.83,因此可认为该观察点为强影响点。142DFFITS它是通过测量一个观测值排除是否对其预测值有影响,从而判断该观测值是否为强影响点[2]。DFFITSi=(i-(i))/s(i)hii,其中i表示用全部数据拟合回归对yi的预测值,(i)表示将第i个观测值排除在外后拟合回

3、归对yi的预测值。通常以2为其界值。本研究中第一组数据DFFTIS值为-2.8688,其绝对值大于2。15根据专业知识判断产生异常值通常有两个方面的因素:一是环境因素的显著变化;二是人为因素。对于环境因素,异常值的出现恰恰是反映实况的突变,所以应结合实际,慎重分析。我们来看,本课题中认为的异常点,第一组观察值中自变量胃酶浓度为0,胆盐浓度为0,胰酶浓度为0,胃酶作用时间5分钟,从专业角度看,几乎相当于所有观察指标皆为0,与要模拟的实际状况是不相符合的。于是从专业来看第一组资料所对应的点可看作异常点。16稳健回

4、归有学者认为,一个样本点是否为异常值,不能单凭它在最小二乘法之下计算的残差去判定,除了经验以及对这样本是如何获得的了解外,用M估计也能有一些帮助[1]。在M估计中,被诊断为“异常值”的观察点,给予的权重都较小,最小二乘法中残差越小的或越接近0的点,给予的权重越大。在此我们采用稳健回归的M估计,根据反复迭代加权最小二乘法,我们知道权重小的点是我们考虑的异常点[4]。本研究中发现第一组试验数据所给与的权重最小,稳健回归得出第一组资料所对应的点为异常点。列出各点最小二乘残差rls及稳健回归中各点的权重:yr估计

5、求得方程为:=22.3843-96.081x1-0.2302754x2-2.209383x3-64.3451x4由此看来稳健回归求得的方程与剔除异常值后最小二乘法求得的方程比较接近,具有一致性,证实了回归诊断的正确性。3讨论一组数据对应空间中的一个点,如果该组数据的残差比其他组数据残差大的多,我们称其所对应的点为异常点;对参数估计或预测有异常大的影响的数据称为强影响数据,所对应的点为强影响点[5]。当然异常点也可能是强影响点,因此它可能对回归的估计以及其它推断产生非同小可的影响。在回归的实际应用中,如何探查异常点

6、,判断出异常点之后应该如何处理,是备受重视的问题。在回归分析中因变量y的取值具有随机性,而自变量x1,x2,…,xp的取值,X=(xi1…,xip),i=1,2,…,n也只是许多可能取到的值中的n组,我们希望每组数据(xi,yi)对未知参数的估计有一定的影响,但这种影响不能过大,这样得到的经验回归方程就具有一定的稳定性。不然的话,如果个别数据对估计有异常大的影响,当我们剔除这些数据之后,就能得到与原来差异很大回归方程,这样必然要怀疑所建立回归方程是否真正描述了因变量与各自变量之间的客观存在的相依关系。随着回归

7、诊断及其图示方法在医学试验数据中的广泛应用,通过它们可以使回归结果更正确可靠[6]。因此本研究通过残差图、学生化残差、Cook’D值及DFFITS统计量法等判定正交试验的第一组数据为异常点并且为强影响点,在此所作的残差图,对于难以图示的多元回归则具有更为重要的实用意义。残差图直观是其优点,但也带来了判断上的主观性,将残差图和相应的假设检验结合起来进行“诊断”是一种较为理想的方法[7]。为了进一步证实判断的异常点的正确性,还采用稳健回归的M估计。本研究中发现第一组试验数据所给与的权重最小,这正与我们回归诊断判断的

8、异常点相符合。由此看来,回归诊断与稳健回归殊途同归,目的相同[8]。从广义上可认为两者是同一个东西,重点都是识别异常点。从狭义上讲,它们思路恰好相反:回归诊断,首先检测异常点,把异常点剔出,剩下的观测作为数据主体,作最小二乘拟合;而稳健回归,则先拟合一个稳健拟合,然后检测出有大残差的异常点。有关异常点的处理,本研究采用剔除异常点用最小二乘法求回归方程和不剔除异常点由稳健回

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。