基于惩罚函数的beta回归变量选择方法

ID：15788987

大小：861.00 KB

页数：16页

时间：2018-08-05

资源描述：

《基于惩罚函数的beta回归变量选择方法》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、基于惩罚函数的Beta回归变量选择方法本文受到国家自然科学基金青年项目（71201139，71303200）、国家社科基金（13&ZD148，13CTJ001）和教育部人文社科项目(12YJC790263)的资助。内容提要：当因变量取值在(0,1)区间的比例数据时，Beta回归是常用的模型，该模型基于因变量服从Beta分布的假设，通过连接函数将样本服从Beta分布的均值与自变量联系起来。本文主要研究基于惩罚函数的Beta回归模型变量选择方法，研究了在LASSOSCAD和MCP三种惩罚方法下的极大似然估计，同时实现了变量选择和

2、回归系数的估计。本文还研究了其渐进性质与Oracle性质，并且给出了计算机模拟。最后，将该方法应用到股息率的影响因素研究中。关键词：Beta回归；变量选择；惩罚函数；Oracle性质中图分类号：0212文献标识码：AVariableSelectionforBetaRegressionbasedonPenalizedFunctionAbstract:Betaregressionisthepopularmodelwhenthedependentvariableisproportionaldataininterval(0,1),w

3、hichassumesthedependentvariableisbetadistribution,connectingthemeanofbetadistributionandindependentvariablesvialinkfunction.Thisarticlemainfocusonthevariableselectionforbetaregressionbasedonpenalizedfunction,givingmaximumlikelihoodestimationwithLASSO,SCADandMCPpena

4、ltymethods,thevariableselectionandestimationofcoefficientscanbeconductedatthesametime.Wealsogivetheproofofitsasymptoticalandoraclepropertiesandtheresultsofsimulations.Finally,weapplythismethodtoselectsignificantfactorsfordividendrate.KeyWords:BetaRegression;Variabl

5、eselection;Penalizedfunction;OracleProperties一、引言线性回归模型是最常用的回归模型，其假设因变量的取值区间为，但对因变量取值限制在区间的比例数据时，直接线性回归建模就不合适了，因为其拟合值很可能会落在区间外。而比例数据在实际中是很常见的，比如股息率、升学率、电视收视率、环境效率等。对于这种比例数据的因变量，传统的方法是将因变量转换到实数区间上，用自变量与转换后的因变量的均值建模。然而，这种方法的回归系数难以解释，而且比例数据通常具有非对称性，基于正态分布假设下做出的推断可能会导致

6、预测失误。为解决传统回归所存在的问题，Ferrari和Cribari-Neto（2004）提出了Beta回归。由于Beta分布的密度函数的形状变化十分灵活，能够描述各种各样的分布，且回归系数具有较好的解释意义，因此广受欢迎。Beta回归模型的参数估计和统计诊断可以通过R包betareg实现（Cribari-Neto和Zeileis，2010）。随着计算机技术的飞速发展，极大地便利了数据的获取和存储，很多部门积累了大量的数据，比如股票市场的逐笔交易记录、商业银行交易记录等，同时这些数据的维度也越来越高，高维模型中噪声变量多，一

7、个最重要的问题是模型选择，在许多情形下，这等价于如何选择自变量的问题。若不对它们加以筛选，引入过多变量，从理论上来说，一方面会导致模型不稳健，极大地降低了估计和预测精度；另一方面会加大模型的复杂度，无法突出最重要的自变量。在回归分析中，往往先引入大量的自变量，然后筛选对因变量影响显著的自变量，这样可以减少模型的设定偏差。关于变量的选择，计量经济学中常用的方法有最优子集法（subsetselection）、逐步（向前、向后）回归法(stepwise)、逐段法（stagewise）等（方匡南等，2014）。但是这些方法存在许多缺

8、点，Fan和Li（2001）指出最优子集法遍历所有子集搜索最优解，因此计算成本高，特别是很大时，基本不可能实现求解;Breiman（1996）指出逐步回归法缺乏稳定性，对数据的微小变动非常敏感。惩罚函数法是目前高维数据研究领域广受欢迎的一类方法,它通过对模型的回归系数进行约束，使部分系数压

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 16



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于惩罚函数的beta回归变量选择方法

基于惩罚函数的beta回归变量选择方法

相关文章

相关标签