房地产销售分析及数据挖掘课件

房地产销售分析及数据挖掘课件

ID:33413304

大小:929.50 KB

页数:33页

时间:2018-05-25

房地产销售分析及数据挖掘课件_第1页
房地产销售分析及数据挖掘课件_第2页
房地产销售分析及数据挖掘课件_第3页
房地产销售分析及数据挖掘课件_第4页
房地产销售分析及数据挖掘课件_第5页
资源描述:

《房地产销售分析及数据挖掘课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、房地产销售分析及数据挖掘提出问题对于房地产销售进行分析以及数据挖掘,有以下问题提出:如何对销售信息进行挖掘,挖掘条件应怎样选择?进行数据挖掘之后,房地产公司如何利用数据挖掘结果增加销售额?具体的说,企业应如何运用OLAP操作和关联规则了解客户的需求,以提供正确的适合各类人群的需求?数据仓库的概念模型1:数据仓库中主要实体联系包括customer、company和house,其中customer的属性包括cumid,name,age,sex,occupatin,marry,income,Income_type,age_type.company的属性包括company

2、_id,name,address,tel。House的属性包括type,class,mianji,province,city,qu,street,louhao,menhao课数据仓库的概念模型实体维表:房子类型维,户型维,房子地址维,销售维,开发商维,客户维,销售日期维数据仓库的逻辑模型星型图:OLAP操作按月份下钻:OLAP操作下钻(按户型):OLAP操作上卷(按年份):OLAP操作切块查询:查询第2、3季度,胡家庙、长乐中路,普通住宅、经济适用房的销售额:OLAP操作切块查询:查询第1、4季度,明德门、电子正街,普通住宅、商业房的销售额:OLAP操作切片查询:

3、按季度和户型查询2011年的销售额OLAP操作切片查询:按季度和小区查询2011年的销售额:数据挖掘操作频繁一项集(性别)数据挖掘操作频繁一项集同上的操作,可以得到其他属性的频繁一项集:职业:教师26经理24企业主23医生23职员31年龄:中年141婚姻状况:是139收入:中122住宅:普通住宅124数据挖掘操作频繁二项集:数据挖掘操作通过查找所有由频繁一项集生成的二项集找出频繁二项集:教师+中年医生+中年职员+中年职员+男教师+已婚经理+已婚企业主+已婚医生+已婚教师+中收入医生+中收入职员+中收入中年+男中年+已婚中年+中收入已婚+男中收入+男已婚+中收入教师

4、+普通住宅经理+普通住宅职员+普通住宅中年+普通住宅男+普通住宅已婚+普通住宅中收入+普通住宅数据挖掘操作频繁三项集:数据挖掘操作所有的频繁三项集:教师中年普通住宅21职员中年普通住宅24教师已婚普通住宅20教师中收入普通住宅21职员中收入普通住宅25经理已婚普通住宅20中年男普通住宅79中年已婚普通住宅99中年中(收入)普通住宅97已婚男普通住宅81中收入男普通住宅76已婚中收入普通住宅92数据挖掘操作所有的频繁三项集:教师中年普通住宅21职员中年普通住宅24教师已婚普通住宅20教师中收入普通住宅21职员中收入普通住宅25经理已婚普通住宅20中年男普通住宅79中

5、年已婚普通住宅99中年中(收入)普通住宅97已婚男普通住宅81中收入男普通住宅76已婚中收入普通住宅92数据挖掘操作由频繁三项集得到的频繁四项集:职员中年中收入普通住宅24中年男已婚普通住宅71中年男中收入普通住宅69中年已婚中收入普通住宅85中收入已婚男普通住宅71数据挖掘操作频繁五项集:中年男已婚(是)中收入普通住宅61数据挖掘操作关联规则:age(x,”中年”)^sex(x,”男”)^marry(x,”是”)^income_type(x,”中”)=>buy(x,”普通住宅”)支持度:61/158=38.6%置信度=61/70=87.1%分类和预测-年龄与月收

6、入的线性回归分析1选取数据分类和预测-年龄与月收入的线性回归分析2数据预处理分类和预测-年龄与月收入的线性回归分析3使用最小二乘方法的直线回归X轴为年龄,Y轴为月收入,得到两者之间的线性关系为如下图。线性函数:Y=64.285X+1786.8,R^2=0.0669分类和预测-年龄与月收入的线性回归分析4预测器误差度量分类和预测-分类及决策树的生成1在数据库中获取分类所需的原始数据分类和预测-分类及决策树的生成2对数据进行数据清理(在excel中操作)分类和预测-分类及决策树的生成3数据变换:年龄:Youth,30岁以下。Middle:31岁—45岁Senior45

7、以上收入:Low:3000元以下Medium:3000元—6000元High:6000元以上购房面积:small<120big>120职业:护士,经理,教授等婚否:是,否性别:男,女分类和预测-分类及决策树的生成4获取分裂属性(1)求取期望信息与信息增益(详见excel表)收入:Info(收入)=0.71008Gain(收入)=0.289129554由excel表可以看出收入在属性中具有信息增益,所以被选作分裂属性。节点n用age标记并对于每个属性值生长出一个分枝。然后元组据此进行进一步的划分。分类和预测-分类及决策树的生成生成决策树分类和预测-分类及决策树的生成

8、由决策树提

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。