微软数据挖掘方案

微软数据挖掘方案

ID:41937921

大小:6.23 MB

页数:73页

时间:2019-09-05

微软数据挖掘方案_第1页
微软数据挖掘方案_第2页
微软数据挖掘方案_第3页
微软数据挖掘方案_第4页
微软数据挖掘方案_第5页
资源描述:

《微软数据挖掘方案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、微软商务智能助力企业科学决策微软广州王颖William.Wang@microsoft.comBI定义与基本理念提升业务洞察力,将数据信息转化为商务价值目标:数据信息转化为商务价值知识决策价值数据信息过程:分析提炼指导创造行动落实报表即席查询个人与部门仪表板分析图表数据整合数据存储数据管理安全一致性、有效性扩展能力……战略价值企业客户数据再利用解决方案可靠、健全企业数据个人&团队业务洞察力企业管理决策力企业数据报表与分析绩效管理应用商务智能系统%时间分配的百分比“无”商业智能(BI)应用系统“有”商业智能(BI)应用系统来源:G

2、artnerGroup收集数据信息分析数据信息知识制定决策制定行动计划执行行动商业智能作用-企业业务管理决策敏捷性数据挖掘功能的定位9种新的算法图形工具/向导12种可内置的视图与AS,SSIS,Reporting紧密集成与Web/Office应用的集成OLAPReports(Adhoc)Reports(Static)DataMining业务知识易用难用可用性相关业务价值瞎子摸象?找Pattern?Trend?Relationship?MiningModelMiningProcess-IllustratedDMEngineDa

3、taToPredictDMEnginePredictedDataTrainingDataMiningModelMiningModelBusinessUnderstanding(Domain)找问题-确定商业目标对现有资源的评估确定问题是否能够通过数据挖掘来解决确定数据挖掘的目标制定数据挖掘计划DataMining的应用020406080%ofRespondentsCustomerprofilingTargetedmarketingMarketbasketanalysisAttritionmanagementFrauddetec

4、tionCreditriskanalysisTypeofApplication完整与强大的算法DecisionTreesClusteringTimeSeriesSequenceClusteringAssociationNaïveBayesNeuralNetLogisticRegressionLinearRegression实际应用英国电信需要发布一种新的产品,需要通过DM的方式向客户推荐这种产品。使DM的回应率提高了100%GUS日用品零售商店需要准确的预测未来的商品销售量,降低库存成本。通过数据挖掘的方法使库存成本比原来减少

5、了3.8%汇丰银行需要对不断增长的客户群进行分类,对每种产品找出最有价值的客户。营销费用减少了30%Clalit健康服务公司是以色列最大的医疗护理提供商,它通过14家医院和1,400家诊所和药房为三百七十万病人提供保健服务。是以色列最大的健康维护组织(HMO)。这个组织已经有90年的历史了,为三千七百万的投保会员提供健康护理。这个人群占以色列人口的60%。Clalit公司通过使用社会人口统计学和医疗记录来确定自己的观点,以此为基础得出一个预测评分。这样可以帮助确定这一年龄段中处于健康恶化高风险期的会员。一旦确定,医生将会试着去

6、用主动治疗护理治疗计划来帮助这些病人,防止健康恶化。DataMining算法--Regression何谓「回归」?某公司业务部经理想要了解该公司影响销售业绩(y)之主要因素并希望能建立一预测模式。案子交由市调部门做市场调查,发现有许多似乎都是很主要之变项因素(例如:广告费、交际费、销售员佣金…等)。如果该业务经理只想找出一个或数个重要的相关之变项因素(X1,X2,…,Xp),如何寻找出?并如何建立预测模式?案例说明某医院医生欲探讨成人血液中的胆固醇是否受到体重、血压及年龄的影响调查10位20至30岁成人男性分析资料编号胆固醇(

7、mg/100c.c.)年龄(年)体重(公斤)血压(mmHg)11752258.211521802862.013031622556.612241602452.812251742559.512461802656.012671562954.310881902865.112891863061.7120101652050.8115选择线性回归选择变量确认变量型态输出结果胆固醇=172.804+2.151*(体重-57.700)或是胆固醇=48.691+2.151*体重散布图及预测值预测值与实际值比较散布图回归分析回归分析建立变量关系的数

8、学方程式之统计程序是将研究的变量区分为因变量与自变量,并建立因变量为自变量之函数模型主要目的是用来解释数据过去的现象及由自变量来预测因变量未来可能产生之数值。自变数(Independentvariable)由数学方程式预测的变量。因变数(Dependentvariable)据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。