欢迎来到天天文库
浏览记录
ID:36656760
大小:1.63 MB
页数:39页
时间:2019-05-13
《基于网络搜索数据的房地产价格预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于网络搜索数据的房地产价格预测——兼论大数据在政府统计中的应用国家统计局统计科学研究所李伟、董倩、孙娜娜摘要本文基于百度搜索指数,采用线性回归、回归树、随机森林、Bagging、m-Boosting和支持向量机6种模型和交叉验证技术分别对北京、上海、广州、深圳、天津、重庆等16个城市的二手住宅销售价格指数和新建商品住宅销售价格指数进行了拟合和预测,结果发现通过运用交叉验证方法,6种模型中选择的最优模型中成功地预测了这些城市的二手住宅和新建商品住宅价格指数。在采用的6种模型中,支持向量机和随机森林模型表现最佳,线性回归模
2、型的预测效果则不够理想。在影响二手房价格的诸多网络搜索关键词中,交易环节和房产政策受到关注较多,而在影响新房价格的网络搜索关键词中,房价走势和房产政策是关注的重点。采用网络数据进行预测不但具有较好的预测效果,而且与传统预测方法和官方调查数据相比具有很强的时效性,预测的月度房地产价格能够比官方数据发布提前约两周。关键词:网络搜索数据,房地产价格预测,交叉验证,支持向量机,随机森林一、引言(一)研究背景:大数据时代中的政府统计人类社会已经进入了一个全新的历史阶段——大数据时代。随着计算机技术全面融入组织运作和社会生活,数据正
3、在以一种超乎想象的速度爆发式地增长。根据联合国的研究报告,全球的大数据存量从2005年的150EB(艾字节)增长到2010年的1200EB,并预计将以40%的年增长率继续增长,2020年将达到2007年的44倍,平均每20个月就翻一番。同时,对大数据的认识和应用在全球范围内也得到了前所未有的提升。2012年3月,奥巴马政府颁布了《大数据的研究和发展计划》,并宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略。2012年5月,联合国“全球脉动计划”发布了题为《大数据1促发展:挑战与机遇》的报告,指出大数
4、据像纳米技术和量子计算一样带来了根本性的变革,将会塑造一个全新的二十一世纪。新加坡电子道路收费系统和美国交通安全管理局都将大数据应用于交通运输统计管理中,谷歌基于搜索数据成功预测了甲型H1N1流感。事实上,大数据在海洋监测、天气预报、网络社交、商业零售服务、社会管理等方面都开始得到应用。在中国,由各级政府主导的大数据计划也正在全面展开。我国《“十二五”国家战略性新兴产业发展规划》明确提出,支持海量数据存储、处理技术的研发和产业化。2012年底,广东省率先启动了《广东省实施大数据战略工作方案》。北京市的网格化试点是大数据应
5、用于公共管理的生动实践。智慧城市则是大数据在城市管理中的综合应用,目前我国已确定了国家智慧城市的试点名单。作为国家统计数据信息的官方生产和管理部门,大数据时代的到来给政府统计带来了巨大机遇和挑战。大数据为政府统计提供着总体性、非结构化、丰富真实的原始资料,可以极大地缩短数据采集时间,减少报表填报任务,减轻调查对象负担,提高统计数据质量。中国政府统计近几年来积极适应这一发展潮流,成功实施企业一套表联网直报等统计四大工程,在居民消费价格统计、第三次全国经济普查中积极利用手持电子终端采集数据,在基本单位名录库维护和房地产价格调
6、查中积极利用电子化行政记录,在人口、农业、投资、交通等领域,大力研究利用遥感(RS)、地理信息系统(GIS)、全球定位系统(GPS)为代表的空间信息技术和物联网技术,既极大提升了统计信息化水平,也为进一步推进大数据的统计应用打下了较好的基础。2013年11月19日,国家统计局与上海钢联、中国联通、百度、阿里巴巴等11家公司签订了大数据战略合作框架协议,共同推进大数据在政府统计中的应用。目前在CPI统计、社会消费品零售总额统计、房地产价格统计中已开始与企业合作,研究、试点大数据的应用工作。(二)研究思路:利用网络搜索数据改
7、进房地产价格统计房地产价格统计是价格统计中的重点。随着经济社会的发展,房地产业成为国民经济发展的重要支柱,房屋在人民生活中的地位举足轻重,人们对房地产价格的关注度也越来越高。政府统计部门十分重视房价统计工作,为了适应不断变化的形势,对房价统计制度方法进行了一系列改革,从2011年1月起开始实施新的房价统计制度方法。对于直辖市、省会城市、自治区首府城市(不含拉萨),计划单列市等35个大中城市,新建住宅销售价格直接采用当地房地产管理部门的网签数据,不再另行调查。房屋销售价格指数调整为新建住宅销售价格指数和二手住宅销售价格指数
8、。调整后不再计算和发布70个大中城市房价涨幅平均数,而是重点发布各个城市的房价数据。改革后的房地产价格指数更加合理,但是由于该指数系列发布时间是每月中旬,其时效性仍无法满足大众的需求,而且在房2价波动较大的时期,发布的房价指数与人们的直观感受也存在一定的差距。为了解决房地产价格的时效性问题,本文尝试用网络搜索数据预测
此文档下载收益归作者所有