欢迎来到天天文库
浏览记录
ID:40127052
大小:2.21 MB
页数:40页
时间:2019-07-22
《《数据分析方法培训》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据分析方法培训目录数据分析前的思考案例分享深层次数据分析数据分析前,我们需要思考3>《孙子兵法〃谋攻篇》:故上兵伐谋,其次伐交,其次伐兵,其下攻城;攻城之法为不得已。像一场战役的总指挥影响着整个战役的胜败一样,数据分析师的思想对于整体分析思路,甚至分析结果都有着关键性的作用。问题分析结果呈现分析思路与方法数据选取数据分析前,我们怎么去思考?每一个步骤可能面临的问题以及需要准备的东西???4>选取的分析软件以及分析方法(统计学相关方法)。分析问题和解决问题的思路5>定义问题第一步首先,要搞清问题的实质,准确、完整、真实地表
2、达问题。其次,弄清楚为什么要解决这个问题?最后,解决这个问题的意义何在?是必须解决还是无关紧要,或是需要马上解决还是不太着急。第二步收集整理信息搜集、整理关于要解决问题的历史资料、类似情况和现状。第三步选取分析方法分析涉及到的主要维度,为后面提取数据需求作准备;第四步数据提取整理根据分析内容以及分析方法,提出分析所需的数据需求;对于反馈回来的数据,需要进行部分加工,以便更能反应所要分析的问题。第五步分析结果及结论根据分析的结果,得出一些当前问题产生的一些结论。这里注意分析的方法以及维度,结果的展示方式等。结论需
3、要求足够的数据做支撑。第六步实施及建议措施针对数据分析结论,给出当前问题的解决建议措施。一方面从业务层面进行建议措施,另一方面,可以就问题点进行更深层次分析,给出数据挖掘层面的解决措施。第七步实施效果评估及报告整理根据措施实施效果进行实际评估,将完成的分析过程,结果以及评估整理报告,为以后出现问题提供经验教训。对于本次没有完全解决的问题,进行说明。例如,从现有的报表数据中就能够看到当前问题点的数据情况或者一段时间的趋势;两个重点步骤精确的陈述问题Where----哪里存在问题?What------存在的问题是什么?Wh
4、y-------原因在哪里?When-----什么时候开始出现这样的问题?Who------与什么对象有关?Howmany-----发生的次数和数量?Howmuch------损失有多大?爱因斯坦说:“精确的陈述问题比解決问题还来得重要”5W2H法:5W:What,When,Where,Who,Why;2H:How及Howmany;使用这个方法阿根廷队世界杯输球了,如果你是马拉多纳,你怎么去思考?定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理问题展现方式问题现状直接原因最终原因问
5、题的结构如同这座冰山初步的问题分析深层次的问题分析问题结构是由现状、直接原因以及最终原因构成的。针对直接原因进行的叫初步问题分析,针对最终原因进行分析的叫深层次问题分析。7>治标治本定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理问题分解8>问题陈述问题/假设1问题/假设2问题/假设3分支问题分支问题分支问题分支问题分支问题分支问题为什么使用逻辑树?1.将问题分成几个部分使•解决问题的工作可以分成智力上能够解决的几个部分•不同部分可按轻重缓急区分•工作责任能分派到各人2.保证问题获
6、得完整地解决•将问题的各个部分解决好,即可解决整个问题•所分问题的各个部分各不相同,而且包括了各个方面(即没有重叠没有遗漏)3.使项目小组共同了解解决问题的框架4.协助重点使用组织框架及理论定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理分析方法统计方法的三大特性,用三句话来简单概括一下:反应客观现象的数据描述性统计(包括统计数据的收集、整理、显示和分析)实用性:除了实情,数据能证明一切;丰富性:统计就像比基尼,露出来的部分固然诱人,没露出来的部分才是最要命的;公平性:我们相
7、信上帝,其它人请用数据说话。概率论(包括分布理论、大数定律和中心极限定理)推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)总体内在的数量规律性9>样本数据总体数据定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理描述性统计分析“五点法”:最小值,1/4分位数,均值,3/4分位数,最大值“两度”:峰度,偏度六西格玛:检验统计量的取值空间6∑10>定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理2120y-1y-2-2-101
8、-1-20221y0y468负相关相关但非线性相关推断统计分析11>回归分析是统计分析思想中最基础、最集中的一个领域。高斯、高尔顿相关分析&回归分析-3-212(a)-212(b)x-2-1012x-3-2-10123x-10不相x关(c)-10正相关(d)变量的选取;预测推
此文档下载收益归作者所有