基于人口普查数据的居民住房状况影响因素实证研究——以郑州市二七区为例

基于人口普查数据的居民住房状况影响因素实证研究——以郑州市二七区为例

ID:35060249

大小:4.19 MB

页数:40页

时间:2019-03-17

基于人口普查数据的居民住房状况影响因素实证研究——以郑州市二七区为例_第1页
基于人口普查数据的居民住房状况影响因素实证研究——以郑州市二七区为例_第2页
基于人口普查数据的居民住房状况影响因素实证研究——以郑州市二七区为例_第3页
基于人口普查数据的居民住房状况影响因素实证研究——以郑州市二七区为例_第4页
基于人口普查数据的居民住房状况影响因素实证研究——以郑州市二七区为例_第5页
资源描述:

《基于人口普查数据的居民住房状况影响因素实证研究——以郑州市二七区为例》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码10463密级□专业硕士学位论文基于人口普查数据的居民住房状况影响因素实证研究——以郑州市二七区为例作者姓名彭霄指导教师孟丽莎教授专业领域工商管理硕士培养院系管理学院完成时间二〇一六年六月AnEmpiricalStudyofFactorsAffectingResidentialHousingSituationBasedonCensusDataADissertationSubmittedfortheDegreeofMasterCandidate:PengXiaoSupervisor:Prof.Men

2、gLishaSchoolofManagementHenanUniversityofTechnology,Zhengzhou,China关于学位论文的独创性声明本人郑重声明:所呈交的论文是本人在指导教师指导下独立进行研究工作所取得的成果,论文中有关资料和数据是实事求是的。尽我所知,除文中己经加|^^>标注和致谢外,本论文不包含其他人已经发表或撰写的研巧成果,也不包含本人或他人为获得河南工业大学或其它教育机构的学位或学历证书而使用过的材料。与我一同工作的同志对研巧所做的任何贡献均己在论文中

3、做出了明确的说明。若有不实之处,本人愿意承担相关法律责任。学位论文作者签名:曰期:2^1占年A月r曰气学位论文使用授权书本人完全同意河南工业大学有权使用本学位论文(包括但不限于其印刷版和电子版),使用方式包括但不限于:保留学位论文,按规定向国家有关部口(机构)送交学位论文,W学术交流为目的赠送和交换学位论文,允许学位论文被查阅、借阅和复印,将学位论文的全部或部分内容编入有关数据库进行检、索,采用影印缩印或其他复制手段保存学位论文。保密学位论文在解密后的使用授权同上。

4、学位论义作者签名;日期:知I《年<月(日^指导教师签名;日期:年月r日凌^摘要近年来,住房问题成为全社会关注度较高的热点话题,使用基层数据尤其是数据挖掘等大数据方法进行建模分析,探索住房相关问题的内在规律十分必要。本文运用第六次人口普查中郑州市二七区的长表数据,尝试建立基于哑变量的多元线性回归模型和基于大数据算法的随机森林模型,分别使用SPSS及R软件进行参数估计,探讨了以户为单位人均住房面积与相关普查统计指标之间关系,力求找出影响人均住房面积程度的因素。多元线性回归分析是反映一种现象或事

5、物的数量依多种现象或事物的数量的变动而相应地变动的规律,可用于定量分析和分类分析。当多元线性回归的自变量为定性变量时,就要借助“哑变量”来进行回归;随机森林是一种比较新的机器学习模型,可以很好的预测多达数千个自变量对因变量的作用,且对自变量间的共线性不敏感,被誉为当前最好的算法之一。本文尝试采用这两种模型来对影响以户为单位的人家住房面积的主要因素进行探索。通过建立基于哑变量的多元线性回归模型和随机森林模型对人均住房面积影响因素进行探索分析,得出以下结论:(1)行政区划、本户应登记人数、住房来源、年龄、户别

6、等指标对以户为单位的人均住房面积影响较大。(2)在分类指标较多的情况下,基于大数据算法的随机森林模型较传统多元线性回归模型使用更简便,拟合优度更高,误差更小。关键词:住房状况多元线性回归哑变量大数据随机森林AbstractInrecentyears,Housingissuehasbecomeahotissueofsocialconcern,itisnecessarytoexploretheinherentlawofthehousingproblemusingbasicdataanalysisanddata

7、miningmodeling.Inthispaper,ItrytoestablishamultiplelinearregressionmodelbasedondummyvariablesandrandomforestmodelbasedonbigdataalgorithmwithbasicdataofErqiDistrictofZhengzhoucityinthesixthnationalcensus.AndItrytoexploretherelationshipbetweenhouseholdasaun

8、itofthepercapitahousingareaandrelevantstatisticalindicators,andtoidentifyfactorsthataffectthepercapitahousingarea.Multiplelinearregressionanalysisreflectsthelawthatonething’schangebasedonotherthings’change.Itcanbeus

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。