网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例

网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例

ID:35186112

大小:2.90 MB

页数:57页

时间:2019-03-21

网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例_第1页
网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例_第2页
网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例_第3页
网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例_第4页
网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例_第5页
资源描述:

《网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:C931.6单位代码:10183研究生学号:2014252046密级:公开研吉林大学硕士学位论文(学术学位)网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例ResearchontheApplicationofWebSearchDataonPredictingRealEstatePriceIndex——TakeBeijingasExample作者姓名:唐一丁专业:管理科学与工程研究方向:数据挖掘指导教师:刘伟江教授培养单位:商学院2016年4月网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例Researcho

2、ntheApplicationofWebSearchDataonPredictingRealEstatePriceIndex——TakeBeijingasExample作者姓名:唐一丁专业名称:管理科学与工程指导教师:刘伟江教授学位类别:管理学硕士答辩日期:2016年5月24日未经本论文作者的书面授权,依法收存和保管本论女书面版本、电子版本的任何单位和个人均不得对本论文的全部或,部分内容进行任何形式的复制、修改、发巧、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否贝IJ,应承担侵权的法律责任。吉林大学

3、硕i学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教师的指导下,独立进行研巧工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名一;了日期:年1月日摘要网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例近年来随着互联网的快速发展以及信息技术的普及,人们的生活已经越来越离不开网络。人们可以利用搜索引擎查询新闻和感兴趣的

4、信息,也可以利用即时通讯软件如腾讯QQ、微信等进行聊天。互联网已经成为了巨大的数据库。网络搜索数据蕴含了三亿多市场主体的兴趣与关注,反映其行为趋势与规律,为研究宏观经济问题提供了必要的微观数据基础。房地产行业是国民经济的支柱性产业,研究中国房价对百姓的生活和社会经济的发展都具有现实意义。北京市作为中国经济、政治和文化中心,也是目前人口聚集度非常高的城市。北京的房价不仅越来越影响到居民的正常生活,而且还关乎着社会的稳定。因此国家统计局发布了70大中城市住宅价格指数,使人们了解房价的变动趋势,同时也为研究人员提供数据依据。本文运用北京新建住宅价格

5、指数和网络搜索数据进行研究。本文从影响房价的微观因素与宏观因素考虑房地产市场的供给与需求,以均衡价格理论和传导时滞为理论依据,建立一个概念框架。在研究过程中运用文本挖掘的方法对网络上的房价新闻信息进行分词处理,得到权重较高的关键词;运用了一些拓展关键词的方法对初步得到的关键词进行拓展,如长尾关键词、需求图谱等;然后,利用皮尔森相关系数和时差相关分析法基于网络搜索数据与北京新建住宅价格指数间的相关系数和领先阶数对关键词进行筛选。本文选取了相关系数绝对值在0.5以上的关键词,继而分别运用K-均值聚类法和主成分分析法对关键词进行处理,得到衡量北京新

6、建住宅价格指数的指标。在实证分析中运用K-均值聚类法对关键词进行分类,得到每个类别里最能代表类别信息的关键词作为解释变量,又运用主成分分析法将关键词进行合并得到两大类指标,分别是微观搜索指标和宏观搜索指标。最后,运用分别得到的解释变量建立北京新建住宅价格指数与网络搜索数据间的回归模型,将两个回归模型的拟合优度和预测精度进行对比。得出结论:(1)对于微观因素的关键词,人们大多会提前一年的时间进行信息的搜索,如二手房信息以及住房的物业管理信息;对于宏观因素的关键词,对房价感兴趣的购房者通常会提前半年到一年的时间关I注价格、工资水平、住房附近的教育

7、水平等信息。(2)北京新建住宅价格指数的一阶滞后项对本身有着显著的解释能力。(3)K-均值聚类分析所建立的模型拟合优度为0.86,运用该模型对2015年08月-12月的北京房价指数进行预测,得到预测值与实际值的平均绝对误差为0.234。与用主成分分析方法所建立的拟合优度为0.82,平均绝对误差值为0.309的模型相比,发现运用聚类分析对关键词进行筛选和优化后能够得到拟合优度更高的模型和误差更小的预测结果。关键词:网络搜索数据,百度指数,K-均值聚类,文本挖掘IIAbstractResearchontheApplicationofWebSear

8、chDataonPredictingRealEstatePriceIndex——TakeBeijingasExampleInrecentyearswiththepo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。