欢迎来到天天文库
浏览记录
ID:11196643
大小:346.00 KB
页数:13页
时间:2018-07-10
《crm中数据挖掘技术在房地产客户关系管理中的应用与流程》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
CRM中数据挖掘技术在房地产客户关系管理中的应用与流程引 言在信息化时代,房地产企业的可持续发展同样离不开信息技术的支撑。长期运行的信息系统积累了大量房地产企业运作的相关信息,面对快速增长的海量信息,利用数据挖掘(DataMining)的相关技术和分析工具,将丰富的信息转换成有价值的知识,实现信息资源的增值利用,将有助于企业发现商机、制定开发计划与营销策略,成为房地产企业市场运作和高层决策的重要参考。1、数据挖掘技术概述数据挖掘是从大量数据中发现潜在关联和模式,做出预测性分析的有效工具,它是现有的一些人工智能、统计学等技术在数据库领域中的应用。数据挖掘技术主要是关联分析、聚类分析、分类、预测和时间序列分析等。应用数据挖掘有助于发现业务发展的趋势,揭示已知的事实,预测未知的结果,并帮助使用者分析出解决问题所需要的关键因素,有利于使用者做出正确的决策。下面简要介绍本文中涉及到的几种数据挖掘技术。1.1关联分析 关联分析反映一个事件和其他事件之间依赖或关联的知识。如果两项或多项属性之间存在关联,那么其中某项的属性值就可以依据其他属性值进行预测。比如,一个借款人己购买了汽车,那么其贷款购买商品房的概率是10%。关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。随着大量数据不停地收集和存储,许多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。从大量商务事务记录中发现有趣的关联关系,可以帮助许多商务决策的制定,如分类设计、交叉购物和贱卖分析。1.2聚类分析聚类分析是把一组个体按照相似性归纳成若干类别,即‘物以类聚”。由聚类所产生的簇是一组数据对象的集合,这些对象根据最大化类内的相似性、最小化类间的相似性的原则进行聚类或分组。所形成的每个簇可以看作一个对象类,由它可以导出规则聚类也便于分类编制,将观察到的内容组织成类分层结构,把类似的事件组织在一起。例如,房地产交易数据库给出的原始数据,聚类方法可以把一些具有相似特征的数据自动地进行分类。1.3分类分类的目的是得到一个分类函数或分类模型(也称作分类器),该模型能按照事先定义的分类标准,把数据库的数据项映射到给定类别中的某一个,即对数据进行归类,而且能够根据分类模型,对其他未分类的或是新的数据做出预测。使用的技术有决策树,记忆基础推理等。例如,可以根据已有的贷款的历史数据,来建立一个借款人信用风险等级分类模型,把贷款申请人的风险划分为不同的等级,以后就可以利用这个模型来对数据库的其他申请者或是新的申请者做出预测。 1.4预测预测是根据已有的长期累积的资料来推测某一属性未知的真值。例如,根据已经买房的人的教育程度、年龄及收入来评估其买房的预算金额。使用的技术有回归分析、时间序列分析和人工神经网络等。预测是根据对象属性的过去观察值来估计该属性未来的值。2、数据挖掘在房地产市场预测中的流程分析一般来说,人们对某一事物要做出科学的预测,首先要弄清预测的目标和影响该目标实现的因素,然后就是分析要实现的目标与各目标之间的具体关系和因素之间的相互关系,接着要在前面定性分析的基础上通过回归、推导或其他的数学方法进行定量的研究,找出该事物发展的规律,在对发现的规律进行检验和完善后即可用于事物将来发展情况的预测。采用数据挖掘技术的流程为:(1)定义问题:清晰地定义出业务问题,确定数据挖掘的目的。(2)数据准备:数据准备包括选择数据-在大型数据库和数据仓库目标中提取数据挖掘的目标数据集;数据预处理-进行数据再加工,包括检查数据的完整性及数据的一致性、去噪声,填补丢失的域,删除无效数据等。(3)数据挖掘:根据数据功能的类型和和数据的特点选择相应的算法,在净化和转换过的数据集上进行数据挖掘。 (4)结果分析:对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识。(5)知识的运用:将分析所得到的知识集成到业务信息系统的组织结构中去。采用数据挖掘技术对房地产市场的预测,方法上与上述预测步骤和流程基本是一致的,但在具体操作程序上要将房地产市场预测与数据挖掘技术的特点结合起来,尤其是定量研究部分。首先,数据挖掘是基于海量数据的“知识发现”工具,这就要求采集大量的关于房地产业投资、建设、销售和国民经济发展的数据,建立符合挖掘技术要求的房地产业数据仓库,并保证数据的正确性和有效性;其次,数据挖掘所得到的结果完全是基于数据的,它有可能揭示了人们所不知道的影响房地产市场各因素间的潜在关系,但也有可能仅仅是数据间的偶然联系,因此对结果的解释和利用需要人们的房地产专业知识。通过以上分析,得到数据挖掘技术应用于房地产市场预测的流程如图1所示。3数据挖掘技术在房地产客户关系管理系统中的应用 随着市场竞争的进一步加剧,房地产企业对客户关系管理的关注比以往更高,能否对客户数据进行合理、有效的利用,决定着一个企业的成败。面对这些海量数据,使用传统的查询分析工具往往不能识别其中有价值的信息,进而不能为企业制定营销策略、开展营销活动提供决策支持,而数据挖掘技术正是在这种市场需求中逐渐发展,并且越来越成熟地应用于房地产客户关系管理((cue)系统中3.1数据挖掘技术在房地产行业各营销阶段的应用房地产行业的客户信息有许多特点,例如,客户群广泛、客户特征描述结构复杂;又如,客户需求层次不一,易受外界因素影响等。因此,有必要针对这种复杂、多变和多层次性的客户信息进行分析挖掘,以识别客户购买行为,发现客户购买模式和趋势,从而,进一步提高企业的服务质量,降低企业营销成本。数据挖掘技术在房地产行业不同营销阶段上的应用如表1所示。表1数据挖掘技术在房地产行业小同营销阶段的应用表 3.2数据挖掘技术在房地产CRM系统的应用将数据挖掘技术应用于房地产CRM系统的具体步骤如下:(1)明确商业目标。应用数据挖掘的首要任务就是要明确商业目标,描述出需要解决的问题,并且确定所要解决的问题属于哪种应用类型,是属于关联分析、时序模式、分类、聚类和预测,还是综合应用。例如,要做房地产客户的流失分析,首先应该明确其主要任务是分类回归和关联分析。(2)数据准备。 数据挖掘是由可以获取的数据驱动的,其成功很大程度上取决于所收集数据的数量和质量。建立可靠数据资源的第一步就是确定系统将要使用数据的数据字典。在建立好数据字典后,要清洗数据,逐列检查数据的完整性、有效性,并验证各数据库之间的一致性。(3)利用数据挖掘技术建立模型。利用数据挖掘的一些算法(如统计回归、逻辑回归、决策树、神经网络等)对数据进行分析,建立模型,并选择好相应的实现工具。假如明确了主要任务是分类,那么可以采用的算法有遗传算法、决策树和人工神经网络等。选择了模型的类型及实现的工具后,有时还需对数据进行预处理。例如,若采用神经网络模型则需做数据转换,有些数据挖掘工具也可能对输入数据的格式有特定的限制(4)反复验证。验证应该从较小的系统(如较小的客户群体)开始,但要完成全过程,即从数据收集和处理,到数据挖掘,最后到产生促销数据结构,如邮件发送列表。通过验证,可以纠正系统中的错误,并有利于用户对系统功能的进一步理解。可以直接使用原来建立模型的样本数据进行检验,也可以另找一批数据对其进行检验,还可以在实际运行中取出新鲜数据进行检验。(5)实施与维护。 在应用模型之后,还要不断监控模型的效果。因为事物在不断发展变化,很可能过一段时间之后,随着购买方式、消费观点的变化,该模型就不再起作用。因此随着模型使用时间的增加,要不断地对模型做重新测试,有时甚至需要重新建立新的模型。3.3应用实例:一个基于房地产客户分类的关联分析本文采用某一时点上的房地产消费者需求抽样调查,对客户进行分类,了解不同类型客户的特点,分析不同类型客户最倾向于做出何种购买行为,以便针对其特点进行促销。首先,由购房者选择最多五个自己在购房决策过程中比较看重的因素,并以总评分100分为前提给出每个因素的看重程度的评分。结果抽样数据显示,尽管价格是影响一个房地产项目定位的重要因素,人们对价格的看重程度仍有较大的差异。因此,本文以客户对价格的关注程度为分类标准,构建了一棵简单的决策树,如图2所示。图2基于价格的决策树决策树中根据购房者对地理位置的看重程度,将购房者分为:价格决定型、价格重要参考型、价格参考型、价格不重要型和价格无关型5种类型。表2是应用决策树得到的客户分类结果。表2应用决策树得到的客户分类结果 其次,对数据库进行关联分析即挖掘出数据库中的关联规则。关联规则的形式化描述如下:令T'是事务的集合,其中的每个事务是项目集I的一个子集。令C是I的一个子集,则C对于T的支持度是:Z(C)=I{t|t∈T,C⊆t}|。C对于T的支持度Z(C)是T中包括C的事务的数目。一个关联规则是X大于等于Y的表达式,这里,X,Y都是集合I的子集。规则X大于等于Y的支持度S定义为。(X∪Y)/|T|(|T|为事务的总个数),可信度α定义为Z(X∪Y}/Z(X)。关联规则挖掘的目的就是发现所有支持度大于一个给定的最小支持度阈值的关联规则。其挖掘步骤可以分为两大步:(1)筛选出事务数据库中所有具有用户指定的最小支持度的项目集(I的非空子集),这些项目集称为频集。(2)利用频集生成所有的关联规则。对每一个频集A,找出A的所有非空子集a,如果比率。Z(A)/Z(a)>minuconf就生成关联规则a大于等于(A一a)。其中minucon为用户指定的最小可信度。挖掘关联规则的算法有多种,最经典的是Apriori算法,许多关联规则挖掘算法都是基于该算法。因此,本文用Aprio ri算法开采频集,并由频集产生相应的关联规则。经过反复试验,选取支持度阈值为5%,可信度阈值为20%较为合理。Apriori算法在文献[12]中已得到详尽论述,在此不再赘述。经过挖掘,发现一些有价值的关联规则如表3所示。表3一些有价值的关联规则可见,表3中列出的关联规则均具有较高的支率和可信度。例如:规则“价格无关型客户=>购买商品房预算在100万元以上”的支持率为8.1%,表示若被调查的客户人数为1000人;那么其中有81人符合关联规则的描述;规则的可信度为37.89%,说明价格无关型客户中有37.89%的人购买商品房预算在100万元以上。然而,为了更加准确地挖掘出有意义的关联规则,还可以进行更深一步的挖掘,即对挖掘出的关联规则更换因果关系,形成新的关联规则与之对比。如表4所示。 对比这两个关联规则可发现,“不那么关心价格的人比较注重地理位置“的可能性(37.89%)比“比较注重地址位置的人不那么关心价格”的可能性(23.43%)高,这说明关联规则“价格不重要型客户较注重地理位置”是一条更有意义的关联规则。4结束语房地产行业是一个数据量大、关联性强、影响因素多的复杂非线性系统。本文对数据挖掘技术在房地产客户关系管理系统中应用的具体方式与方法进行了探讨。数据挖掘技术为房地产CRM提供了具有创造性的解决方案,帮助房地产企业解决了销售、营销、服务等业务环节的问题。参考文献:[1]王光宏,蒋平.数据挖掘综述[J].同济大学学报(自然科学版),2004,32(2):112-118.[2]JiaweiHan,MichelineKamber数据挖掘概念与技术影印版)[M].北京:高等教育出版社,2001.[3]陈峻青.基于数据挖掘的房地产价格分析与预测[D].广州:中山大学硕士学位论文,2007.[4]何丽.基于W eb挖掘的决策支持系统模型研究[D].天津:天津大学博士学位论文,2005.[5]赵永进.基于数据挖掘对股票分析与预测研究[D].郑州:郑州大学硕士学位论文,2005.[6]毕建欣.数据挖掘技术在保险领域中的应用[J].华南金融电脑,2004(8):97-101.[7]熊腾科.基于数据挖掘的金融预测模型[D].厦门:厦门大学硕士学位论文,2006.[8]李先光,刘颖,袁竞峰,等.房地产市场分析预测中的数据挖掘技术应用研究[J].贵州工业大学学报,2007,36(1):44一8[9]裘建国.基于神经网络的南京市房地产市场预警系统研究[D].南京:东南大学硕士学位论文,2006.[10]张蓉.数据挖掘技术在房地产客户关系管理系统中的应用[Jl.现代情报,2006,26(6):18s-187.客户关系作业 CRM中数据挖掘技术在房地产客户关系管理中的应用与流程学院:工商管理学院专业:市场营销班级:1153学号:21姓名:刘爽
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处