Beta回归模型在数据挖掘预测中的应用

Beta回归模型在数据挖掘预测中的应用

ID:36611887

大小:535.24 KB

页数:3页

时间:2019-05-12

Beta回归模型在数据挖掘预测中的应用_第1页
Beta回归模型在数据挖掘预测中的应用_第2页
Beta回归模型在数据挖掘预测中的应用_第3页
资源描述:

《Beta回归模型在数据挖掘预测中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第8卷第3期南通大学学报(自然科学版)Vol.8No.32009年9月JournalofNantongUniversity(NaturalScienceEdition)Sept.2009Beta回归模型在数据挖掘预测中的应用李泽安,葛建芳,章雅娟(南通大学计算机科学与技术学院,江苏南通226019)摘要:为避免利用常规的线性回归模型分析时出现的拟合值超出取值范围的情况,应用beta回归模型研究房地产销售数据.首先基于极大似然估计得到了房地产销售率的预测估计和区间估计,数值结果表明,该模型要比其他回归模型更科学、更合理.然后基于预

2、测估计,提出了一些针对不同家庭收入群体的销售策略.关键词:beta回归模型;比例数据;预测;数据挖掘中图分类号:TP274文献标志码:A文章编号:1673-2340(2009)03-0083-03ApplicationofBetaRegressionModelfortheDataMiningForecastLIZe-an,GEJian-fang,ZHANGYa-juan(SchoolofComputerScienceandTechology,NantongUniversity,Nantong226019,China)Abstra

3、ct:Toavoidthesituationinwhichthefittedvaluegoesbeyondtherangeofvaluesinthelinearregressionmodel,thebetaregressionmodelisusedtoanalyzetherealtydata.Thepredictionestimationandintervalestimationfortherealestatesalesrateareobtainedbasedonmaximumlikelihoodestimation.There

4、sultsshowthemodelisbetterthanothermodels.Thenweputforwardsomesalesstrategiesinviewofthepotentialbuyerswithvariousincomes.Keywords:betaregressionmodel;proportiondata;forecast;datamining0引言用回归分析来揭示响应变量(因变量)与自变量之间的关系,从而研究数据挖掘问题中客观存在的规数据挖掘技术是在20世纪80年代被提出来律,并作出合理的预测分析.若响应

5、变量为比例的的,并在90年代取得了长足的发展,是当今数据连续数据,即其取值范围为(0,1)区间时,利用经库系统及其应用领域中的一个热点话题.数据挖掘典的线性和非线性回归模型进行预测研究时,常常方法通常分为两类:描述性方法和预测性方法.常表现为不尽如人意,原因在于其拟合值经常超出上用的方法包括:关联规则、决策树、聚类分析、回归下界[3-5]分析、神经网络、预测估计、时间序列、异常分析、描,即预测值往往在(0,1)区间之外,因而不述和可视化法等.回归分析方法是数据挖掘[1-2]技术符合实际问题的需要.处理方法之一是对响应变量中重要的

6、方法之一,在很多实际的问题中,常利作适当的数据变换,使其取值范围变换为整个实数收稿日期:2009-01-14基金项目:南通大学自然科学基金项目(08Z032)作者简介:李泽安(1977—),女,讲师,硕士,主要从事数据挖掘方面的研究.E-mail:li.za@ntu.edu.cn·84·南通大学学报(自然科学版)2009年空间,然后假定变换后的响应变量的均值是解释变T其中β=(βT是未知的k维参数;x1,…,βk)t=(xt1,量(自变量)的线性形式[6].此方法有2个主要的缺…,xtk),t=1,…,n为协变量;g(·)是一个

7、严格单点:其一是模型中的参数不易根据原有的响应变量进调且二次可微的联系函数,在应用中通常取g为行合理的解释,因此模型的解释性比较差;其二是由logistic形式,即g(μt)=log{μt/(1-μt)},模型(2)和于比例数据不对称,从而不宜基于误差分布为正态TT(3)称为beta回归模型,参数为θ=(β,准).可以假定进行统计推断.此外,由于比例数据之间还往往看出,beta回归模型中响应变量的方差会随着其均变现为异方差[5],利用常规的线性回归模型进行统计值的改变而改变,因此它是一个异方差的回归模分析,会带来很多问题,且分析

8、、预测的效果比较差.型.由式(2)和式(3),beta回归模型形式上可以看通常对于取值范围在(0,1)区间的连续数据,作是一种广义的回归模型.可用连续型随机变量beta分布来刻画,因为betaS.L.P.Ferrari等系统地研究了beta回归模型,分布随机变量

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。