欢迎来到天天文库
浏览记录
ID:33145161
大小:1.47 MB
页数:32页
时间:2019-02-21
《基于pena距离的几种回归模型的影响分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:10286分类号:02418密级:公开UDC:51学号:086278东南大学硕士学位论文基于Pena距离的几种回归模型的影响分析研究生姓名指导教师申请学位级别专业名称:胡江:林金官教授:理学硕士:概率统计东南大学数学系二零一二年一月一令一一平一月InfluenceanalysisofseveralregressionmodelsBasedonthePenadistanceSubmittedfortheDegreeofMasterofScienceByHuJiangSupervisor:Prof.LINJinguanSouthea
2、stUniversityNanjing,210096,ChinaJanuary,2012东南大学学位论文独创性声明及使用授权的说明一、学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标明和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。二、关于学位论文使用授权的说明签名日期:——东南大学、中国科学技术信息研究所、国
3、家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权东南大学研究生院办理。签名:导师签日期:——摘要在统计学中,异常点对统计诊断的结果影响很大,并且当异常点是由数据的内在特性造成时,有时具有特殊的意义,这往往是发现新知识,确定新状态的有力手段,所以异常点的检测在统计学中有着至关重要的作用。传统检测异常点的方法是研究删除一个点(或一组点)对回
4、归分析的影响及对模型预测值的影响,或者是某个样本点(或某组样本点)的微小扰动对参数估计的影响及对模型预测值的影响。而Pena距离是美国统计学教授DanielPENA在2005年提出的一种检测异常点的方法,它通过Pena距离这一统计量研究样本中各个点删除后对某一特殊样本点的回归值及预测值的影响,是检测异常点的又一重要方法,是对检测异常点方法的重要补充,并在某些情况下对异常点的检测优于Cook距离。Pena距离定义为:Si=焉,其中s。=(矾一吼(1),吼一雪;(2),⋯,矾一吼(。)),矾为第i个数据点的玑拟合值,玩fjl为删除第J个点后Y
5、i的拟合值。DanielPENA对Pena距离在线性回归模型的影响分析做了详细的研究,孟丽丽、卢志义把Pena距离推广到加权最小二乘估计的影响分析。本文在DanielPENA、孟丽丽等工作的基础上,重点研究了Pena距离在非线性模型、广义线性模型、t一回归模型中的影响,得出这三种模型Pena距离表达式分别是:文2瓦,fi:。惫露,弓2忐巍=麦耋器碍,乃=怨&2舞妻禹鳄,弓2南然后分别讨论了它们的分析性质,给出了利用PenaI眍离检测异常点的方法,并通过具体事例分析说明方法的有效性,对部分事例给出了具体计算Penal_离的Matlab操作步
6、骤。在某些情况下,利用Pena距离检测异常点优于cook距离,特别是对高杠杆异常点的检测,Penal酾离的效果更加明显。关键词:Pena距离非线性回归模型广义线性回归模型线性近似数据删除AbstractInstatistics,outlierpointshaveatremendousimpactontheresultsofstatisticaldiagnosisOutlierpointscanbeasufficientmeadstodiscovernewknowledge,determinenewstatebecausetheyhaves
7、omeparticularmeaning.Hence,checkingoutlierpointsisveryimportantinstatistics.Traditionalmethodofcheckingoutlierpointsischeckingtheinfluencesonregressionanalysisandpredictionsbydeletingonepoint(oragroupofpoints).Anothertraditionalmethodistocheckhowthelittleperturbationaffec
8、ttheestimationsofparametersandpredictions.In2005,DanielPENA,anAmericanprofessorofstatistics,gave
此文档下载收益归作者所有