基于多元线性回归模型的缺失浮动车数据填充研究

基于多元线性回归模型的缺失浮动车数据填充研究

ID:34874238

大小:4.55 MB

页数:55页

时间:2019-03-13

基于多元线性回归模型的缺失浮动车数据填充研究_第1页
基于多元线性回归模型的缺失浮动车数据填充研究_第2页
基于多元线性回归模型的缺失浮动车数据填充研究_第3页
基于多元线性回归模型的缺失浮动车数据填充研究_第4页
基于多元线性回归模型的缺失浮动车数据填充研究_第5页
资源描述:

《基于多元线性回归模型的缺失浮动车数据填充研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于多元线性回归模型的缺失浮动车数据填充研究THERESEARCHONFILLINGTHEMISSINGFLOATINGCARDATABASEDONTHEMULTIVARIATELINEARREGRESSIONMODEL刘璐哈尔滨工业大学2015年12月国内图书分类号:O21学校代码:10213国际图书分类号:519.2密级:公开理学硕士学位论文基于多元线性回归模型的缺失浮动车数据填充研究硕士研究生:刘璐导师:赵毅副教授申请学位:理学硕士学科:概率论与数理统计所在单位:深圳研究生院答辩日期:2015年12月授予

2、学位单位:哈尔滨工业大学ClassifiedIndex:O21U.D.C:519.2DissertationfortheMasterDegreeinScienceTHERESEARCHONFILLINGTHEMISSINGFLOATINGCARDATABASEDONTHEMULTIVARIATELINEARREGRESSIONMODELCandidate:LuLiuSupervisor:AssociateProf.YiZhaoAcademicDegreeAppliedfor:MasterofScienceSpecialit

3、y:ProbabilityandSatisticsAffiliation:ShenzhenGraduateSchoolDateofDefence:December,2015Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学理学硕士学位论文摘要在现实生活中,数据缺失问题是很广泛存在的,无论是在交通方面还是在社会经济研究、生物医药研究等诸多领域中数据缺失现象都是不可避免的。因为数据存在缺失,不单会增加分析研究任务的复杂程度,这样既会大大降低了统计工作

4、的效率,又会导致统计分析结果的重大偏差。所以,为了得到较为完整的数据,采用数理统计的方法对缺失的数据进行填充,是数据处理中不可缺少的重要步骤。本文就是以浮动车数据为例,来研究缺失数据的填充方法。本文研究的主要内容是,将深圳市路网与浮动车数据相结合,得到路网中存在的缺失数据,为了填充缺失部分提出多元线性回归模型,尽可能使得数据覆盖路网范围更广,形成路况发布指南,方便人民出行。具体如下:考虑到交通数据的时空相关性,分析在多尺度下路网的空间相关性,得到缺失数据插补的空间相关因素,同时分析浮动车数据的时间相关性,确定了时间窗的尺度

5、,为后文插补缺失数据模型奠定基础。结合时空相关性,应用多元线性回归模型。首先仅结合空间相关性建立模型,通过选取训练数据做验证分析,效果不好,精度较低;为了提高精度引入时间相关性因素建立模型,进行对比验证,得到在结合时空关系的多元线性回归模型填充缺失数据更具有普遍适用性,并总结该模型适用的四种情况,同时根据课题组成员针对热点区域的研究得到的三个热点区域,分别进行遍历填充。最后是实证分析部分。本文通过对热点区域福田区为例,选取训练数据对模型进行实证校验,通过实证数据校正模型的准确性,然后对实际道路缺失的数据进行填充并与该缺失部

6、分历史存在数据做佐证,进行路况发布。本文的研究能够得到一个结合时空相关性填充缺失数据的可靠模型。关键词:浮动车数据;多元线性回归模型;时空相关性-I-哈尔滨工业大学理学硕士学位论文AbstractInreallife,missingdataproblemiswidespread.Whetherintransportorinthesocio-economicstudy,asamplesurvey,biomedicalresearchandmanyotherareas,themissingdataphenomenaareine

7、vitable.Becauseofmissingdata,itwillnotonlyincreasethecomplexityofthetaskanalysis,butalsocausetheseriousbiasofstatisticalanalysisresults,whichsubstantiallyreducestheefficiencyofstatisticalwork.Therefore,inordertoobtainmorecompletedata,usingmathematicalstatisticalme

8、thodstofillthemissingdataisanimportantpartofdataprocessing,andisalsooneoftheimportantmethodstoimprovedataquality.Inthisarticle,usingafloatingcardataasan

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。