欢迎来到天天文库
浏览记录
ID:35044597
大小:1.51 MB
页数:36页
时间:2019-03-16
《偏t正态数据下基于最小一乘的回归估计和变量选择》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、偏t正态数据下基于最小一乘的回归估计和变量选择重庆大学硕士学位论文(学术学位)学生姓名:黄亚慧指导教师:钟波教授专业:统计学学科门类:理学重庆大学数学与统计学院二O一六年四月ParameterEstimationandVariableSelectionBasedonLADRegressionforSkew-t-NormalDataAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheMaster’sDegreeofScienceByH
2、uangYahuiSupervisedbyProf.ZhongBoSpecialty:StatisticsCollegeofMathematicandStatisticsofChongqingUniversity,Chongqing,ChinaApril,2016重庆大学硕士学位论文中文摘要摘要在现实生活中,我们收集到的实际数据,特别是某些数量经济和生物医学数据,非常频繁的存在异常值,而且这些数据经常不服从正态分布,而是服从具有一定偏度和尾部占更大比重的分布,这样一些数据的分布一般用偏t正态分布来刻画。于是,对偏t正态数据的统计分析具有
3、重要的理论和实际意义。此外,在实际数据的收集过程中,很多抽样调查数据和实验数据都会受到无回答的干扰或是因为某种原因而丢失。因此,对缺失偏t正态数据的研究也是十分必要的。另一方面,对于呈现重尾分布或带有异常值的数据集,普通最小二乘或极大似然方法因其对异常值的敏感性估计效果可能不会理想,而最小一乘方法对异常值具有良好的耐抗性,并且统计分析结果不依赖于误差项的分布,稳健性比最小二乘和极大似然方法的稳健性好。基于此,论文的主要工作和获得的结果如下:第一:针对来自线性回归模型的有缺失的偏t正态数据,为减少数据中异常值对参数估计的影响,提高回归参数
4、估计的稳健性及准确性,论文选取了回归插补方法处理缺失数据,并运用最小一乘方法估计回归参数,通过随机模拟方式,将论文给出的参数估计方法与极大似然估计方法对比,发现本文的方法是有效可行的。第二:在变量选择方面,为了进一步验证LAD方法的稳健性,对服从偏t正态分布的上证医药卫生指数,我们利用Wang等提出的LAD-lasso方法对其成分股进行了变量选择的实证分析研究,并与基于OLS的lasso方法进行对比,发现LAD-lasso方法在偏t正态分布下变量选择效果是理想的。关键词:偏t正态数据,最小一乘估计,回归插补,线性回归模型,LAD-las
5、soI重庆大学硕士学位论文英文摘要ABSTRACTInreallife,themostcollecteddata,especiallyintheeconomicandbiomedicalareas,doesnotstrictlyobeynormaldistribution,butcouldbedescribedbySkew-t-Normaldistributionwhichhasaveryheavytailorsuffersfromsevereoutliers.Sothestatisticalanalysisforskew-t-norm
6、aldataistheoreticallyandpracticallysignificant.Moreover,inthecollectionprocessofrealdata,alotofsamplesurveydataandexperimentaldatawillbeinterferencedbecauseofnoanswerfactorsorwillbelostforsomeotherreasons.Therefore,itisnecessaryforresearchonanalysisofskew-t-normaldata.Mo
7、reover,intermsofthisdatasetwithheavy-taileddistributionoroutliers,bothordinaryleastsquare(OLS)methodandmaximumlikelihood(ML)methodaresensitivetooutlierssothattheeffectivenessofparameterestimationforthesetwomethodsseemsnotgood.However,theleastabsolutedeviance(LAD)methodis
8、resistanttotheseoutliersandhasbetterrobustnessthantheOLSandMLmethods.Besides,statisticalresultsoftheLAD
此文档下载收益归作者所有