电子商务环境下的数据挖掘初探

电子商务环境下的数据挖掘初探

ID:5180879

大小:1.35 MB

页数:19页

时间:2017-11-13

电子商务环境下的数据挖掘初探_第1页
电子商务环境下的数据挖掘初探_第2页
电子商务环境下的数据挖掘初探_第3页
电子商务环境下的数据挖掘初探_第4页
电子商务环境下的数据挖掘初探_第5页
资源描述:

《电子商务环境下的数据挖掘初探》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、电子商务环境下的数据挖掘初探南航信息中心黄文强2008年12月4日内容提要数据挖掘概念数据挖掘方法论航空公司数据挖掘应用电子商务与数据挖掘航空电子商务数据挖掘应用案例分享1.数据挖掘概念-定义知识发现(KDD)knowledgediscoveryindatabase从数据中发现有用知识的整个过程从大量数据中提取出可信的、新颖的、有用的并能被人理解的模式的高级处理过程。数据挖掘(DM)KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式(patterns)。“模式”可以看成是“知识”的雏形,经过验证、完善后形

2、成知识。1.数据挖掘概念-KDD过程数据源数据数据集成目标数据预处理后数据转换数据模式知识数据选择预处理数据挖掘数据转换结果表达和解释数据准备数据挖掘结果表达和解释1.数据挖掘概念-方法和技术归纳学习方法决策树方法集合论方法仿生物技术神经网络方法遗传算法公式发现物理定律发现系统BACON经验公式发现系统FDD统计分析方法利用统计学原理通过对总体中的样本数据进行分析得出描述和推断该总体信息和知识的方法。模糊数学方法利用模糊集合理论进行数据挖掘,如模糊聚类、模糊分类等。可视化技术利用可视化技术分析数据库,找到潜在的

3、有用信息。1.数据挖掘概念-几种模式分类分类问题属于预测性的问题,它跟普通预测问题的区别在于其预测的结果是类别。典型三种算法:Logistic回归;决策树;神经网络应用场所:判定类别等聚类指把一组个体按照相似性归成若干类别。典型算法:基于欧氏距离;K-means算法应用场所:市场细分关联挖掘发现大量数据中项集之间有趣的关联或相关联系典型算法:Apriori算法;FP-Growth算法;应用场所:交叉销售(购物篮-啤酒与尿布)偏差检测(异常点分析)在数据库中找出异常数据。应用场所:欺诈检测预测利用历史数据找出变化

4、规律的模型,并用此模型预测未来。时序模式通过时间序列搜索出重复发生概率较高的模式。这里强调时间序列的影响。2.数据挖掘方法论由厂商提出的SPSS的5‘A(Assess,Access,Analysis,Act,Automat)SAS的SEMMA(Sample,Explore,Modify,Model,Assess)MICROSOFE的OLEDBforDM由行业组织提出的CRISP-DM(CrossIndustryStandardProcessforDM)CRISP-DM起源于1998年,当时NCR、Clement

5、ine(1998年为SPSS收购)、OHRA和Daimler-Benz(现为Daimler-Chrysler)的联合项目组提出CRISP-DM的六个阶段方法论各有优劣,都有成功案例2.企业数据挖掘的主要任务实施数据挖掘是企业的一个战略性举措,具有极其深远的意义,有助于企业提高其在同行业内的核心竞争力数据挖掘可以帮助企业更充分和有效地将企业积累下来的用户数据利用起来,更深刻地洞察用户的行为,使得企业的经营决策更加有的放矢对于企业而言,数据挖掘不是万能的,没有数据挖掘也未必是万万不能的企业数据挖掘的外延也许更加广泛

6、,一切利用数学工具建立起的解决企业经营管理的某一方面问题的数据模型都可以认为是数据挖掘的任务数据挖掘是一个循环的探索过程,各个环节同等重要。对企业而言,数据挖掘工作需要长期持续地进行,新经济危机正是展现数据挖掘威力的黄金时机2.数据挖掘的典型行业应用几种主要的数据挖掘技术都已经在银行电信行业得到广泛的应用聚类分析关联规则分类预测模型(决策树,Logistic回归)1应用了数据挖掘技术之外的机器学习和统计建模技术KPI预测(混沌时间序列分解预测方法,BP神经网络预测方法)集团客户流失预警(层次分析法)更多的数据分

7、析方法2新的挖掘课题更侧重于高级数量分析3客户生命周期(管理营销学的实践,多模型支撑的分析过程)响应模型(市场分析模型与数据挖掘模型的应用结合)运筹学模型(应用于经营规划的优化)3.数据挖掘在航空公司的应用电子商务领域传统客户关系管理呼叫中心常客俱乐部代理人管理航线分析航线分类与聚类渠道管理定座控制BIDT/MIDT稽查财务资金监控经营考核指标机务零部件库存工单航务正常率飞行品质……4.电子商务与数据挖掘互联网开放技术使数据更详尽、更容易获得,快速数据挖掘成为可能交易订单访客行为搜索引擎WEB2.0蓝海、长尾电

8、子商务面向个人个性化服务要求针对客户群体细分的市场反应个性化市场反应需要快速的数据分析与知识发现提升网站黏度5.数据挖掘案例分享客户流失(分类模型、Logistic回归算法)用户流失预测(分类模型、神经网络、Logistic回归算法)购买倾向预测(分类模型、Logistic回归算法)增量销售预测(分类模型、Logistic回归算法)客户价值增长预测(分类模型、Logistic回归算法)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。