欢迎来到天天文库
浏览记录
ID:26084856
大小:50.00 KB
页数:4页
时间:2018-11-24
《数据仓库和数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据仓库和数据挖掘 摘要:本文阐述了数据仓库及数据挖掘的有关概念,简述了数据仓库、数据挖掘的实施过程,介绍了如何应用数据挖掘。并对数据仓库与挖掘技术结合应用的发展做了展望。 Abstract:Inthispaper,itexpatiatesandanalysestheconceptsofDataine,outlinestheimplmentingprocessofdata. 3.2.2取样工作人员在上步的数据集中随机抽取样本。 3.2.3建立模型取样后,建模人员要对所取的样本进行逐个分析,并将数据分为两类:训练
2、数据集体和验证数据集体,然后选用最佳方案来建立模型或规则集。一般来说,有多种方法来出库数据挖掘的问题的类型,而这些方法通常也是与数据在形式上一一压的。因此,在建立模型的工程中,经常需要返回到初级准备阶段。 3.2.4验证模型模型确立后,建设人员还应该根据验证前后模型的准确性。 3.2.5模型评估模型评估的标准是根据上面三个步骤的模型来作为评分的。挖掘主机评分的主程序中的数据都是由已建立的模型通过循环的方式获得的。 3.2.6执行如若要运用模型对新的数据进行处理,可以保留或改善模型。数据挖掘的步骤并不是一个流水
3、线,所以它不可能一次性做完所有任务。过程中有许多乃至全部的步骤需要循环进行,所以每一个阶段不是一成不变的。 3.3数据挖掘工具的新的技术和应用热点介绍文本挖掘、网络挖掘两种。 3.3.1文本挖掘文本挖掘,顾名思义,就是从非结构化的文本中发现潜在的概念以及概念间的相互关系。在这项技术中,是分词技术中的关键部分,词典的运行。只有让计算机依据词典完成正确之后,才可以实现将非结构化信息转化为结构化信息,然后就可以进一步研究文本之间的关系。目前,像IBM、微软等主流挖掘工具以及google和SNS网站都已经在使用广西挖掘
4、技术。但遗憾的是,目前这些工具大多只支持英文,还不支持中文挖掘。 3.3.2网络挖掘网络挖掘从主体上来看,可分为三种挖掘:文本挖掘、结构挖掘以及点击挖掘。 4数据挖掘(DM)实际应用 DM工具和软件已经在各个领域中得到广泛的应用,收到的效益显著。 4.1金融方面为了让市场经理以及业务员能够更好的融入到公司活动和设计新的市场活动中,可以用DM对不同的业务,不同的信息走向,以及一些决策进行合理的划分。 4.2客户关系管理方面DM不仅可以协助了解客户的行为,还可以找出产品的使用模式,从而一定程度上改变通道管理的
5、程序,就好比只有理解顾客的作息周期性规律,才能更好的进行销售。 4.3在过程控制/质量监督保证方面大量变量之间的相互作用是通过DM来协调的,某些异常数据,DM会自动识别,并进行相应的处理措施,从而让技术人员能够发现问题所在的范围,并及时处理。 4.4远程通讯部门基于DM的分析协助组织策略变更以适应外部世界的变化,根据市场要求进行模式化的该百年来知道市场行为。在网络容量利用方面,DM客户在服务使用的结构和模式的了解,从而指导容量计划人员对网络设施作出最佳投资决策。 4.5使用DM进行军号事信息系统中的目标特征提
6、取、态势关联规则挖掘等。 5总结 发展数据仓库可以促进数据挖掘越来越成熟,但是数据挖掘并不一定要有数据仓库的支持。因为数据仓库并不是数据挖掘的必要条件,有很多数据挖掘可直接从操作数据源中挖掘信息,而且数据挖掘仍然经常被看做是数据的后期市场产品。数据仓库平台的数据挖掘的构造具有很强的实用性,效率很高,节省资源。
此文档下载收益归作者所有