机器学习方法和线性随机效应混合模型 在纵向数据预测上的对比

机器学习方法和线性随机效应混合模型 在纵向数据预测上的对比

ID:5362872

大小:653.25 KB

页数:7页

时间:2017-12-08

机器学习方法和线性随机效应混合模型 在纵向数据预测上的对比_第1页
机器学习方法和线性随机效应混合模型 在纵向数据预测上的对比_第2页
机器学习方法和线性随机效应混合模型 在纵向数据预测上的对比_第3页
机器学习方法和线性随机效应混合模型 在纵向数据预测上的对比_第4页
机器学习方法和线性随机效应混合模型 在纵向数据预测上的对比_第5页
资源描述:

《机器学习方法和线性随机效应混合模型 在纵向数据预测上的对比》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、HansJournalofDataMining数据挖掘,2015,5,39-45PublishedOnlineJuly2015inHans.http://www.hanspub.org/journal/hjdmhttp://dx.doi.org/10.12677/hjdm.2015.53006CompareMachineLearningMethodsandLinearMixedModelswithRandomEffectsofLongitudinalDataPredictionHongmeiLi1,XizhiWu21SchoolofMathematics

2、,YunnanNormalUniversity,KunmingYunnan2SchoolofStatistics,RenminUniversityofChina,BeijingEmail:1193097334@qq.comstththReceived:Jul.1,2015;accepted:Jul.18,2015;published:Jul.30,2015Copyright©2015byauthorsandHansPublishersInc.ThisworkislicensedundertheCreativeCommonsAttributionInter

3、nationalLicense(CCBY).http://creativecommons.org/licenses/by/4.0/AbstractThisstudyinvestigatesthelongitudinaldataofproteinincowsbyusinglinearmixedmodelswithrandomeffectsandothermethodsincludingsixmachinelearningmethods(trees,boost,bagging,randomforest,neuralnetworks,supportvector

4、machines)withRsoftwareandmakescompas-sionandpredictionforthedata.Accordingtothechangeofthetrainingsetandvia8-foldcrossva-lidation,itanalyzesthemeansquareerrorandshowsthetraditionallinearmixedmodelswithrandomeffectsmethodisinferioringeneraltothemachinelearningmethodnomatterforthel

5、ong-termorshort-termforecasting.Herelong-termforecastingcorrespondstothelargersizeoftrainingsetsandsmallersizeoftestingsetsinmachinelearningterminology.Also,machinelearningmethodsarestable.KeywordsLinearMixedModelswithRandomEffects,MachineLearningMethod,LongitudinalData,Cross-Val

6、idation,StandardMeanSquareError机器学习方法和线性随机效应混合模型在纵向数据预测上的对比12李红梅,吴喜之39机器学习方法和线性随机效应混合模型在纵向数据预测上的对比1云南师范大学数学学院,云南昆明2中国人民大学统计学院,北京Email:1193097334@qq.com收稿日期:2015年7月1日;录用日期:2015年7月18日;发布日期:2015年7月30日摘要本文针对牛奶中所含蛋白质的纵向数据,利用R软件,运用机器学习方法中的决策树、boost、bagging、随机森林、神经网络、支持向量机和传统处理纵向数据的线性随机

7、效应混合模型做预测对比。变化训练集并进行八折交叉验证,对得到的标准均方误差分析可知:对于该数据,无论是长期预测(训练集更大)还是短期预测,传统的方法远远不如机器学习方法,机器学习方法有很好的稳健性。关键词线性随机效应混合模型,机器学习方法,纵向数据,交叉验证,标准均方误差1.引言纵向数据是指一段时间内对每个个体在不同的时间点进行观察记录而得到的数据,与横截面相比,纵向数据的优势主要在于它更加有效的估计了样本内和样本间随时间变化的趋势。纵向数据主要是处理响应变量和协变量的变化关系,同时还要考虑响应变量组内的相关性。Verbeke同Molenberghs[1

8、],Raudenbush[2],Collins[3]以及Davidian[4]等

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。