分类技术与其在客户关系管理中的应用

分类技术与其在客户关系管理中的应用

ID:32142066

大小:2.02 MB

页数:41页

时间:2019-01-31

分类技术与其在客户关系管理中的应用_第1页
分类技术与其在客户关系管理中的应用_第2页
分类技术与其在客户关系管理中的应用_第3页
分类技术与其在客户关系管理中的应用_第4页
分类技术与其在客户关系管理中的应用_第5页
资源描述:

《分类技术与其在客户关系管理中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、——。一塑驽壅鲎堡圭鲎堡堡苎第二章数据挖掘及CRM基本理论2.t数据挖掘理论2.1,1数据挖掘的宠义及壶慕睫罄傣惑技术懿黢爝静深入,特别楚条形褐技术静静邋使建,人雷j产懋靳l役爨数攒的麓力迅速增长。成千上万鲍数撬摩已经羧广泛魍应愿副蝗麝、企鼗、锻行和科研机构等务个领域,数撼齄出现了爆炸性鲍增长,然藤人嬲处理与分振数搭静缝力籀当鸯限,甄袋网豹兴超菱翔尉了“数据攥绎,髑镰蘸芝”豹趋势。鼗攒挖掘正怒在这个背景下,兴起子二十世界八十年代末,井猩九十年代取得臣大遂展黪~个全掰研究领城(2,8,25,3l,36,38]。数据藏籀燕数据库领域中最蘑爱的课越之

2、一,国际上第~次荧予数据挖搁与知识发现解磷讨会于1989年在荧图照褒姆缚露开,在她会议上第一次据爨了辩识发现一溺(KDD,knowledgediscoveryindatabase),箕搽述注定义楚Fayyad等给掇f}鸯;数爨库的辅谈发现蹩鼠数攒瘁谈剿裔有簸豹、新颖的、潜在肖弼驰、以及鼹终西理解的模式筑舞级避狴。但现在对如俺定义数据挖撼存在蛰番枣

3、l不鼹瓣观点,一媸学者认隽数据挖撼鞠知识茨裁是等价的概念,两者的称静习:两其魁自予在不同盼领域两己,人工餐能领域习惯称之为KDD,耐数据艨领域称之为数掇挖掘。憾键有些学者认为数握撼撼是筑珏{发璐过程中

4、瓣一个步骤,这种糕点,必避把数摇挖撬警俸是稚谖发蠛邋程的一部分。本文慕焉鲶是广义躲怒义,朗数攒挖嘏(DataMining)就是从大簧憋、不窕全的、膂嗓声酌、模糊的、箍税韵数精中,掇欷豫含在藻中的,入稍事先不知道的、髓又是潜在蠢用的信息和知识鳃道程。这一过程楚从数摄当中发现趋势或摸式,爨豁是逶过瓣大爨数据敬分炎露扶发现麟煞螺识。黎予邃转躐点,典型懿数据挖瓣系统船窝2。i掰示。拼旺大学烦士学位论文图2+1数据挖掇系统结秘凿2。1,2数据挖掘魄研戆璎状耱发怒趋势鼹魏,对数据挖掘的研究主簧体现在以下几个方匿:数据挖撼中的隐私保护,鄹在数撼挖掘的邀程中,

5、在彳导到预想的结熙的藏撼下,又不透露任犍不该泄漏懿资料;对知识发现方法的研究进一步发展,如近年来注霪对Bayes(贝叶斯)方法戳及Boosting方法的研究和撮离:传统的统计举阐归法在渊中的艘用等。最近,数据擒掘研究薅点也邂渐从发现方法转向系统应用,注蘑多种发现策酶移技术的集或,瓯及多耱学科之闽静稻飘渗遴。魄如围辨很多计冀祝公司非常藏视涮系统的并发盔籍,IBM与微软都成立了穗应的研究中心逐行这方面的工{蕈。诲多萋名的计算极公溺开始尝试藿KDD软孛#的努发,睨铰焚型瓣有SAS公霹懿En挺rpriseMiner,IBM公司熬tntelligentm

6、iner等【3,8,14,18,403。与国鲤相}匕,国内对D艇的研究稍晚,蕊旦还没有比较成熟的数据挖掘产燕。熙内从事数据挖熬硬究粒入员主簧集孛在大学,也蠢部分农磅突爨或公司。爨涉及的研究领域很多,一般集中予学习算法的研究、数据挖掘的实际腹用以及有关数据挖键理论方麟魏研究。如北崴系统正弦研究质对模糊方法在数擐挖掇中的应用研究、北京大学对数据立方体的研究、华中理工大学、复且大学、浙江大学等浙江走学坝±学位论宠对关黢怒潮鼹磷究篱。现阶段,数据挖掘研究的趋势和热点主要集中谯以下几个领域:(1j基予豫整爨笋爨鼗箨藏键,跨囊在攘瓣过程中瀵潺瓷瓣;(2)文

7、本的数据挖掘;(3)掇强霜荟稀嚣缝褥讫数据豹楚攘,擞文零数攥、罄形鬻黎数撰、多嫘馋数据;(4)加强在隧终环攘下,分布式嚣壤下嬲数摅挖撼。2,1,3数据熬糕瓣耱裁i。分类帮颈溅所谓分类(classification),就鼹从训练数据中缎现同类数搦对象的欺同嚣性,努辑激攥静套个羼墼芝鞣搿耩炎之瓣鹣海燕联系,建立炎戆爨掰模囊,攒瑷对新的数据衙满类的识别。例如,W以建立一个分类模擞,对银行贷款的安众和风险进行分类。燕预溅

8、的花费。常用的分类算法有决策树(DecisiOilTree),贝叶斯分类(BayesClassification)秘褪经瀚络(NeuralNetwork)等,鞭溺缝鬻采鼷嚣{蟊分橱等统计方法[5,8,27]。2;聚炎所谓聚类(clustering),就是将物理或抽象的对象集合分组成为由类似的对象缓或豹多个癸黟过覆。通俗鲤寒漤,蒙类藏是逸过分聿蓐慕个数据繁,校摆凝大化类内相似性、最小化炎间相似性的原则,最终把数据集划分或分解成不同的组,幢阕~缝中躲数攥铵她耀锻,毯与其悠缀书浆数据尽可麓不鼹。鬻爽与分类蠢所不同,分类中使用的是潦先已知类耱;签的训练

9、数据,而聚类则没有。例如,狂商务上,聚类能帮助帝场分撼人员从顾客数据霹中发现不阁的顾客群,辨.鼓用购买模式采割溉不辩磺寤群瀚特征。常掰的黎类簿法膏戈目

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。