欢迎来到天天文库
浏览记录
ID:30308585
大小:20.39 KB
页数:9页
时间:2018-12-28
《探索性数据分析报告》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、为了适应公司新战略的发展,保障停车场安保新项目的正常、顺利开展,特制定安保从业人员的业务技能及个人素质的培训计划探索性数据分析报告 企业里都有哪些需求? 一般调研业务部门都会听到如下需求,以销售部为例: 1.需要看到总体销售情况; 2.需要看到各个销售渠道、销售组织、产品、客户等的销售额,能够进行任意销售所需维度的销售情况; 3.需要看到以上内容和去年的同比、与销售计划的比值等,用于进行销售完成情况的监控; 4.需要关注核心产品销售状况、客户区域的销售情况等; 5.销售数据要严格保密,因此一定要设置权限; 6
2、....... 我们来梳理下需求,将其转换为数据。以上需求基本可以看到数据字段需要有:销售额、计划额、销售额同比、计划完成率、销售渠道、销售区域、销售组织、产品名称、产品分类、客户名称、日期等。按照维度和度量可以分为销售渠道、销售组织、产品名称、客户名称、日期等和销售额、计划额、销售额同比、计划完成率等 不了解业务能否进行数据分析? 根据需求获取到数据并建立完成指标体系后,可能会遇到一些问题,例如: 1.不了解销售部的销售体系如何确定字段间的相关性?目的-通过该培训员工可对保安行业有初步了解,并感受到安保行业的发展的
3、巨大潜力,可提升其的专业水平,并确保其在这个行业的安全感。为了适应公司新战略的发展,保障停车场安保新项目的正常、顺利开展,特制定安保从业人员的业务技能及个人素质的培训计划 2.不了解市场营销的资源投入内容如何确定字段的权重? 3.字段无法识别,如何进行相关预测? 4.除了可以制作KPI指标外,还可以做什么? 统计学历史上的故事,统计与传染病的故事,待补...引用观点:首先还必须要弄明白,数据统计和数据的解释是两个概念,两个阶段,不能等同。数据的用处,通常会有描述、解释、预测、控制四个层次。我们通常使用的统计方法,也分
4、为描述统计及推断统计。所以,我认为在读与数据有关的文章时,也必须先做到剥离“数据本身”和“数据解释”两个层面的内容,以便对数据做出客观独立的思考。如何开展数据分析工作? 我们可以先从观察数据本身着手,将已有数据现状进行客观的展现。首先恶补下统计学原理,描述性统计是统计分析的重要组成部分,是推断性统计的基础,它是指用统计表和统计图或利用统计指标来描述资料的特征。描述性统计包含两部分内容: 1.数值变量描述,是对观察对象的某个指标采用度(衡)量的方法进行检测目的-通过该培训员工可对保安行业有初步了解,并感受到安保行业的发展的
5、巨大潜力,可提升其的专业水平,并确保其在这个行业的安全感。为了适应公司新战略的发展,保障停车场安保新项目的正常、顺利开展,特制定安保从业人员的业务技能及个人素质的培训计划 2.分类变量描述,是先对观察测量得到的变量值(即观察值)进行分类汇总(即“计数”)得到分类资料频数表(属于绝对数指标),再在此基础上计算相对数指标(即两个指标之比)才能对分类变量资料进行正确的描述 数值变量的统计学描述 1.频数表。包括频数又称频率,是指某一变量观察结果在某一特定数值(或数值范围内)出现的次数。将事物分类之后统计出来的各类频数排列成表
6、格,即为频数表。利用频数分析,可从一大堆变量观测值中直观地了解变量的分布特征 2.集中趋势的描述。描述一组观察值分布集中位置或平均水平的指标称为平均数。它能使人对资料有个简明概括的印象,并能进行资料问的比较。常用的平均数有算术平均数、几何均数和中位数 3.离散程度的描述。集中趋势是数据分布的一个重要特征,但单有集中趋势指标还不能很好地描述数据的分布规律。为了比较全面地描述数据分布的规律,除了需要有描述集中趋势的指标外,还需引入描述数据分布离 散程度的指标。描述离散趋势的指标有多种,最常用的有极差、四分位数间距、方差、标
7、准差和变异系数 4.相关分析。探讨数据之间是否具有统计学上的关联性,这种关系既包括两个数据之间的单一相关关系——如年龄与个人领域空间之间的关系,也包括多个数据之间的多重相关关系——如年龄、抑郁症发生率、个人领域空间之间的关系 分类变量的统计学描述目的-通过该培训员工可对保安行业有初步了解,并感受到安保行业的发展的巨大潜力,可提升其的专业水平,并确保其在这个行业的安全感。为了适应公司新战略的发展,保障停车场安保新项目的正常、顺利开展,特制定安保从业人员的业务技能及个人素质的培训计划 1.比:任意两个变量之比 2.构成比
8、:部分占总体的比例 3.率:某现象发生的频率和强度 4.动态数列:一系列按时间序列排列起来的统计指标,用以说明事物在时间上的变化和发展趋势 5.率的标准化:用统一的“标准”消除资料由于内部构成不同而对所比较的总率产生的影响,使资料间具有可比性。标化率只是表明对比资料的相对水平,并不反
此文档下载收益归作者所有