欢迎来到天天文库
浏览记录
ID:43020049
大小:30.50 KB
页数:5页
时间:2019-09-25
《@caoz:数据分析那点事》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、@caoz:数据分析那点事先声明一下,按照传统的定义,我还真不是数据分析高手,各种关联算法,只会最简单的一利「(话说不少场合还算管用);各种挖掘技术,基本上一窍不通;各种牛逼的数据分析工具,除了最简单的几个免费统计平台Z外,基本上一个都不会用。所以,各种高手高高手请随意BS,或自行忽略0这里说点高手不说的。从微博段了说起,微博上关于数据分析有两个段了,我经常当作案例讲,笫一个段了,说某投资商对某企业所属行业冇兴趣,要做背景调查,甲是技术流,一周分析各种网上数据,四处寻找行业材料,天天熬夜,终于写出一份报告;乙是人脉流,和对方高管喝了次酒,
2、请对方核心人员吃了顿饭,所有内幕数据全搞定,问谁的方法是对的;第二个段子,某电商发现竞争对手淘宝店,周收入突然下降了30%,但是隔周后又口然恢复,中间毫无其他异常现象,于是老板让分析师分析,苦逼的分析师辛苦数日,做各种数学模型,总算找到勉强的理由白圆其说,老板读毕,虽说不能让人信服,却也没有更合理的解释,某FI,见对手老板,闲聊此事,“你们某段时间怎么突然收入下降?''“嗨,别捉了,丈母娘去世了,回家奔丧,公司放羊了。”老板恍然大悟。两个段子,第一个段子,微博上一边倒的说,苦逼分析没有人脉有用;第二个段子类似,一边倒的认为,人脉的消息比苦
3、逼分析管用多了。但是我想说的是,这个解读绝对是错的!先说第一个段子,其实网络不乏这种“人脉达人”,特别是媒体圈,一些所谓的“IT名记”或者“箸名评论家、分析师”和各种互联网大佬称兄道弟,天天秘闻不断,但是呢?他们从不研究产品,不分析用户,所以,他们知道了数据,却不懂数据背后是什么,更不知道什么是重要的,什么是次要的,我有时会批评身边这样的朋友,别天天觉得白己知道几个互联网人佬的花边新闻,就当白己是资深业内人丄•了,正因为掌握这些东西乂觉得炫耀,才反而忽视了真正有价值的信息和有价值的数据。这就是为什么混网络媒体的,见过市面的各种达人,在互联
4、网创业浪潮里,几乎没有成功几率的真实原因,自以为人脉广泛,无所不知,其实止因为缺乏最基木的数据背景分析,所以才是看上去什么都愦,细究下其实什么都不懂。请记住一点,除非你是富二代,官二代,衔着金钥匙出牛,那不在我的讨论范围里,否则,没有苦逼的经历,就没有牛逼的成就。我常订阅一些著名分析师的微博,他们透露的数据往往是很有价值的(这是我订阅的原因),但是他们的解读通常是惨不忍睹的,这就是只看表象的恶果,而且随便翻看一下他们的数据解读,可以说他们的数据感和数据认知贫乏到可笑,甚至缺乏最基本的数据校核和考证的能力,他们拿到了某公司核心数据又怎样?没
5、经历过苦逼的分析,他们其实什么都看不到。第二个段子同理,如果不是持续有效的数据跟踪,怎么能得岀下降3()%的结论,这一数据结论与人脉得到的消息相互验证,才会得到完整真实的结果,否则仅仅是闲聊,你怎能知道对方企业管理对业绩影响的范畴,苦逼的分析也许一时没有人脉的消息管用,但是你所得到的对数据的认知和积累,是人脉永远不会给你的。所以,再次强调,基木的数据跟踪和LI常的数据感养成,绝不是可以忽略和无视的。人脉情报可以成为数据解读重要的信息来源,但是绝不能喧宾夺主,替代基本的数据分析工作。下面说一下数据感,什么是数据感?就是别人说一个数据出來,你
6、会琢磨一下这个是否符合常理,与你口常的数据观测经验是否一致,如果不一致,那么可能的理由是哪些?比如12306号称一天儿十亿次点击,如果你有数据感,笫一眼就会质疑这个“点击”定义的合理性;比如曾经有人说某国内图片分享网站一天多少亿访问量,第一眼就知道这个“访问量”定义是有歧义的,(事后官方解释是图片加载量,这个和访问量差异几十倍。)数据感需要不断的培养,和基木的逻辑(比如你应该知道屮国有多少网民,每天有多少人上网,一个大概什么类型,什么排名的网站会覆盖网民的比例是多少),以及善于利用各种工具,我以前在巨头公司,得益于公司巨大的数据资源,可以
7、看到很多互联网的核心数据;但是离开后,才发现,其实互联网上公开可获取的数据途径是非常多的,而且善于利用的话非常有效。每天去查询一些感兴趣的数据,经过一段时间积累,想没有数据感都难。作为公司或团队负责人,怎么培养员工的数据感,我其实也有一个建议,平时可以搞一些小的竞猜,比如团队集体竞猜新产品或产品改版上线后的FI活跃用户,或者pv数字,或者收入数据,等等;然后看谁的最准,一种是惩罚制,最不准的请最准的喝奶茶,吃冰淇淋;另一种不惩罚,最准的累计积分后公司可以发一些奖品鼓励,这样下去人家的数据感就会在H常培养起来,而且对团队的气氛培养也有帮助。
8、数据感之后,谈数据分析的方法,我的建议是,不炫技,不苛求技术复杂度,最简单的数据,所包含的信息往往是最有价值的,而很多人恰恰这一步都没做好,就总想着弄一堆挖掘算法;数据的价值在于正确的解读,而
此文档下载收益归作者所有