欢迎来到天天文库
浏览记录
ID:46230124
大小:338.87 KB
页数:9页
时间:2019-11-21
《构建一个有指导的数据挖掘模型》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、构建一个有指导的数据挖掘模型2014-10-0811:26LinkinPark36大数据字号:TIT
2、收藏什么是冇指导的数据挖掘方法模型,以及数据挖掘如何构建模型。在构建一个冇指导的数据挖掘模型,首先要理解和定义一些模型试图估计的目标变量。-•个典型的案例,二元响应模型,如为直接邮寄和电子邮件营销活动选择客户的模型……AD:2014WOT全球软件技术蜂会北京站课程视频发布11月21H-22H与WOT技术大会相约深圳现在抢票数据挖掘的冃的,就是从数据中找到更多的优质用户。接着上篇继续探讨有指导数据挖掘方法模型。什么是有指导的数抓挖掘方法模型,以及数抓挖掘如何构建模型。在构
3、建一个有指导的数抓挖掘模型,首先要理解和定义-些模型试图估计的H标变量。一个典型的案例,二元响应模型,如为直接邮寄和电子邮件营销活动选择客户的模型。模型的构建选择防史客户数据,这些客户响应了以前类似的活动。有指导数据挖掘的目的就是找到更多类似的客户,以捉高未來活动的响应。这构造冇指导的数据挖掘模型的过程中,首先要定义模型的结构和目标。二、增加响应建模。三、考虑模型的稳定性。四、通过预测模型、剖析模型来讨论模型的稳定性。下面我们将从具体的步骤谈起,如何构造一个冇指导的数据挖掘模型。有指导数据挖掘方法:•把业务问题转换为数据挖掘问题•选择合适的数据•认识数据•创建一个模型集
4、•修复问题数据•转换数据以揭示信息•构建模型•评估模型•部署模型•评估结果•重新开始(有指导数据挖掘方法模型)步骤:1、把业务问题转换为数据挖掘问题《爱丽丝梦游仙境》中,爱丽丝说“我不关心去哪儿”。猫说:“那么,你处哪条路都没什么问题”。爱丽丝乂补充到:只要我能到达某个地方。猫:“哦,你一定能做到这一点,只要你能走足够t的时间。”猫可能有另外一个意思,如果没有确定的目的地,就不能确定你是否已经走了足够长的时间。有指导数拥挖掘项H的冃标就是找到定义明确的业务问题的解决方案。一个特定项H的数拥挖掘H标不应该是广泛的、通用的条例。应该把那些广泛的目标,具体化,细化,深入观察客
5、八行为可能变成具体的目标:•确定谁是不大可能续订的客户•为以家庭为基础的企业客户设定一•个拨打计划,该计划将减少客户的退出率•确定那些网络交易可能是欺诈•如果简萄酒和啤酒已停止销伟,列出处于销伟风险的产品•根据当前市场营销策略,预测未來三年的客户数屋有指导数据挖掘往往作为一个技术问题,即找到一个模型以解释一组输入变量与目标变量的关系。这往往是数据挖掘的屮心,但如果目标变最没冇正确的定义以及没冇确定适当的输入变最。反过來,这些任务又取决于对要解决的业务问题的理解程度。没冇正确的理解业务问题就没办法把数据转化为挖掘任务。在技术开始Z前,必须认识两个问题:如何使用结果?以何种
6、方式交付结果?上述两个问题,都是建立在客户的真正需求是什么?而不是作为数据挖掘工程师认为的什么是有用的数据,什么对客户最好的数抓。这些结果看似有利于客户提薛销伟额,但是我们交付的结果是什么,我们有理解客户的需求吗?所有前提,不耍着急急着动手,先理解真正需求,不可盲目主断。1.1如何使用结果?例如:许多数据挖掘工作旨在捉高客户保留•主动向高风险或高价值的客户提供一个优惠,挽留他们•改变获取渠道的组合,以利于那些能带来最忠实客户的渠道•预测未来儿个月的客户数量•改变会影响乳户的满运度的产品的缺陷这些目标都会对数据挖掘过程产生影。响。通过电话或玄接邮寄的营销活动接触现冇客户,
7、意味着除了确定客户风险Z外,你要了解为什么他们处于风险中,从而可以构造一个冇吸引力的优惠。电话,不能过早或过迟。预测意味着除了确定那些客户可能离开,确定冇多少新客户加入,以及他们会停留多久。而新客户的加入,不只是意味着预测模型耍解决的问题,还是被纳入到业务H标和预算Z中。1.2如何交付结果?有指导的数据挖掘项目可能会产生儿个不同类型的交付形式。交付形式往往是一个报表或充满图标和图形的简报。交付形式会影响数据挖掘的结果。当我们的目的是提醒销售惊雷时,产生一个营销测试的乳户列表是不够的。所谓的如何交付结果,就是在挖掘结果产生之后,我们耍如何给川户提供这个结果,目的是好的,但
8、实际的过程中会遇到,会遇到我们没有办法去交付这个结果。因为,你交付的结果,可能会导致一些木不该流失的客户,却流失了。这也是在具体工作之前,我们要考虑的问题。数据挖掘人员的作用是确保业务问题的放厉表述可以被转换成一个技术问题。前提是止确的业务问题。2、择合适的数据2.1什么数据可用?寻找客户数据的首要地方就是企业数据仓库。仓库中的数据已经被清洗和核实过,并且多个数据源被整合到一•起。一个单一的数据模型冇望确保命名相似的字段在整个数据库和兼容的数据类型中都冇相同的含义。企业数据库是一个历史数据库,新数据不断的被追加,但历史数据一貢不变。从这一
此文档下载收益归作者所有