5个要点,让你拥有数据分析思维
本文分析了如何拥有数据分析思维的5个要点:说事实,而不是观点、用客观标准代替主观判断、不预设立场、演绎而不是归纳、找出背后的逻辑。
引言
数据分析师究竟要掌握哪些技能?
大部分的数据分析教学都会教你excel,Python,sql,机器学习,还有一些分析方法比如对比分析、漏斗分析、留存分析等等技能。
但是,很多人 掌握了这么多工具和技能,依然做不好数据分析 。面对具体的业务问题,我们还是容易两眼一抹黑。
就像我们大部分人学习英语,都会学习单词、语法、音标等等,但是一开口就跪了。而英语母语的人就算不懂语法是什么,却能如同抬手睁眼一样自然地用英语表达。
这其中的区别,便是因为英语母语的人拥有“英语思维”。
想要做好数据分析也一样,单单会工具和技能是不够的,还必须拥有数据分析思维。数据思维决定了你如何思考问题,如何搭配这些分析方法,如何得出结论,如何确定问题。
那么究竟什么是分析思维呢?我认为有以下几个方面。
1. 说事实,而不是观点
数据分析师第一个要训练的思维方式便是: 只说事实,不说观点。
事实和观点这两个名词看起来区别很大。但实际上在生活中我们经常会将两者混淆。
比如说你的同事告诉你: 最近的转化率大幅下降 。
这句话到底是事实还是观点呢?
很显然这句话是观点。究竟下降多少算大幅下降?也许你认为的大幅下降在我看来变化并不大。
那么如果他说: 转化率下降了。 这句话是事实还是观点呢?
这句话看起来已经非常像事实了,但是实际上它依然属于观点。
有这样一种情况,转化率在短期内它看起来是下降的,但是你站在宏观的层面上,以月为单位甚至以年为单位,它是它是上涨的,那么你究竟说他是上涨还是下跌呢?
那么什么是事实?
周一到周三的转化率持续下降,周三相比周一已经下跌了5%。 这句话就是事实,这句话不同的人都能理解,不会出现歧义。
只有分清楚观点和事实才有继续分析的可能性。
因为观点的沟通会出现误差,而事实则不会。如果我们用观点进行沟通,自然会出现大量的误解。
如果连背景都没有理解清楚,后续的分析也就无从谈起。
2. 用客观标准代替主观判断
但是单纯只有数据,对业务问题的分析没有什么帮助。毕竟我们得知道这个数据到底带来了哪些业务信息。所以最后事实还是要归纳成“观点”。
不过如果我们用主观判断数据的好坏,那么还是回到了原来的老路上去。
那么周三相比周一转化率下跌了5%,这个数据到底表现如何呢?
想要解读出观点,我们需要先 找到一个标准 。
标准怎么找?
- 可以是老板定的标准,看数据是否符合老板心中的标准。虽然这也是拍脑袋,不过老板毕竟是老板,他们心中有些战略构想是建立在某些条件满足的基础上的。所以没什么说的,如果老板不满意,那这数据肯定是有问题的。
- 可以看行业和竞品的平均标准,看数据下降是否是行业的普遍现象。
- 看企业过去的平均水平,可以在历史数据中找到类似场景下的数据情况,和自己的过去对比。
然后我们通过数据和这些标准进行对比,得出一个观点。比如我们可以分析每周的情况,看历史上是否存在这一的趋势,平均下跌是多少?如果历史上每周三都会下跌,平均下跌7%,那么我们就可以认为目前数据比较正常,没有问题。
这样得出的结论全都是客观的,如果你不找标准,而用主观判断数据的好坏,那么不同部门的人会沟(shuai)通(guo)很久。
3. 不预设立场
人们总是习惯于通过自己的现存经验和知识去判断未知事物。
这本身是进化带来的优势,它能让人在信息不完备的情况下迅速做出决断并付诸实施。
这种预设立场的思维在原始人的时代很有价值,其优势在于:
- 第一,不浪费宝贵的能量,大脑是能量消耗大户;
- 第二,快速决断,避免因为低效决断而错失机会,这一点在避免伤害时尤为重要。
在数据分析的场景下,我们需要尽可能地找出真实原因。此时这种预设立场的决断方式会造成许多错误,因为现有经验和知识在应对未知事物时是不足的,是有偏差的。
而且不同岗位的人还会存在“屁股决定脑袋”的现象。
如果出现了业务问题,关联的业务方往往预设一个立场:这事没有看起来那么糟,或者这事和我没关系。
比如 转化率下降了 ,业务方的反应往往是这个 数据下降 肯定跟自己无关 。
自己的运营活动明明做的很成功,转化率下降一定是行业因素、用户质量等等其他因素导致的。于是为了证明这个观点,他们顺着这个预设的前提,找到一些相关的证据来解释转化率下降的现实。
实际上,想要证明一个观点,只要你肯去找,不管观点多么荒谬,总能找到支持你的理由。
不仅辛普森悖论这种统计学的把戏可以得出完全相反的结论,即使最简单的“真话不全说”的方法,也能达到这种目的。
比如,我说两个比较荒诞的列子:
1. 把正例说成反例
我想要证明一种物质是有害的,我列举出以下论点:
- 它是酸雨的主要成分;
- 对泥土流失有促进作用;
- 过多的摄取可能导致各种不适;
- 皮肤与其固体形式长时间的接触会导致严重的组织损伤;
- 吸入该物质容易引发窒息;
- 处在气体状态时,它能引起严重灼伤;
- 在不可救治的癌症病人肿瘤中已经发现该物质;
怎么样,你会不会觉得这是一种非常危险的物质,实际上上面描述的是“水”。
2. 想要把反例说成正例也没问题
比如中国男足,想要把男足描述成世界强队行不行?
当然行。
- 哥斯达黎加是世界杯史上为数不多能够战胜中国队的国家
- 即使是巴西队这样的世界强队也仅战胜过中国队一次
- 自2002年韩日世界杯后,中国队在世界杯正赛上不败纪录已经延续12年
- 纵观漫长的世界杯史,中国队也仅输过三次
- 中国队从未在世界杯点球大战中失利过
- 中国队在领先的情况下从未丢过球
你看,只要你想证明一件事,总能找出一些证据。
所以, 预设立场再去找证据是一件相当不靠谱的事 。
数据分析部门一般独立于业务部门之外,这样可以确保数据分析师没有业绩压力,分析具有独立性。
因为数据分析的独立性,所以最终问题究竟是在产品上、运营上或者市场上,数据分析师不会有明显的偏向,只认客观数据。
同样是转化率下降了,数据分析师的职责就是找出下降的真实原因。他们要梳理出和转化相关联的各个环节,获取数据,根据数据推演出合理的结论。
有些资深的数据分析师有一定的业务敏感度,他们会提出一些可能性很大的假设。比如他们猜测可能是运营出现了问题,那么就需要找到一些数据来验证这个假设。
但是假设验证和预设立场不同。
预设立场,是要找到证据来证明猜想,一个数据不行,那就换另一个数据。直到能证明这个观点为止。
而验证假设,则是事先规划验证这个假设需要的数据。如果数据最终不符合假设,那么就抛弃这个假设。
好的数据分析师,能够根据客观数据,随时抛弃旧的假设,并建立新的假设。
抛弃固有的思维定式,这是非常反人性的,这也是为什么说数据分析需要专业训练的原因。
4. 演绎而不是归纳
逻辑思维方法分为归纳法和演绎法。
归纳法是从特殊到一般的推理 ,是从结果找原因的方法。
也就是说,通过观察很多个别事物的特殊性,然后概括出同类事物的特征。
但是我们一般不可能观察到这个事物的所有样本。所以归纳法得出的结论是不确定正确性的。
你有没有听过这个故事:
在一个火鸡饲养场里,一只火鸡发现,不管是艳阳高照还是狂风暴雨,不管是天热还是天冷,不管是星期三和星期四,每一天上午的9点钟,主人都会准时出现,并给它喂食。
于是,它得出了一个惊天大定律:“主人总是在上午9点钟给我喂食。”
时间来到圣诞节的前一天,上午9点,主人又一次准时出现,但是这一次,主人带来的并不是食物,而是把它变成了食物….
这个是英国哲学家伯特兰·罗素提出的一个问题,被称为「罗素的火鸡」,用来讽刺那些归纳主义通过有限的观察,得出自以为正确的结论。
大部分人思考问题,会优先使用归纳法。因为这是人类认识世界的方法,这是人性决定的。
比如一月到三月的成交金额连续上升,初级分析师往往会说:成交金额呈现上升的趋势。
这句话的潜台词是,预计交易金额在四月份也会上升。
这是典型的归纳法思维:因为过去是这样的,所以未来应该也会继续这样。这和那只火鸡的思维其实也没有什么本质的差别。而且这和没分析一样,你把数据丢给业务方,他们也能看出目前呈现上涨的趋势。
如果想要做好数据分析,就不能滥用归纳法,这点依然很反人性。
那我们用演绎法,如何思考这个问题的呢?
演绎法是从一般到特殊的推理 ,是从原因找结果的方法。
要想预测四月份的成交金额会如何,首先需要分析前三个月的成交金额为什么会上涨?当时的背景是什么?上涨需要哪些条件?四月份的这些条件是否依然存在?如果维持成交金额上涨的条件不变,我们才能说四月份会继续延续这种上涨的势头。
经过演绎法推理的结论才是合理的,而且我们通过深挖找出了内部的原因,这才是业务人员想要知道的。
数据分析的价值就体现在这。
5. 找出背后的逻辑
数据分析师是需要大量的逻辑思维训练,但我们自己做好还不够,我们的工作必需和业务方沟通,帮助他们解决实际的业务问题。
但是很多业务人员没有考虑清楚就跑来沟通,他们的需求可能充满了逻辑问题,这时我们就需要帮对方理清思路,找出对方表述背后的逻辑。
数据分析师往往会听到业务方这样问:本周的转化率相比上周已经下降了5%,怎么办?
这句话听起来感觉没什么问题,实际上逻辑并不是特别严密。
首先,这句话的前半部分很好地表达了事实,值得表扬。如果前半句是一个观点,我们还要先找到事实。
但是这句话的后半句有问题,后半句的“怎么办”,放在这个语境中,潜台词其实是这样的:
- 本周转化率相比上周下降了5%
- 这是个不好的情况
- 需要解决这个问题
- 怎么办?
相比最开始的表述,我们分析出这句话中间出现了两个衍生的问题。
问题1:转化率下降5%真的是不好的情况吗?
这就涉及到了标准了,之前提到了我们要找到一个客观标准,通过标准解决出数据的业务含义。
因此我们首先要协助业务方找到一个标准。
问题2:如果数据表现真的不好,那么这是现在急需解决的问题吗?
这个问题的答案也是不一定。
商业世界要解决的问题太多,在同一时刻,永远存在着各种各样的问题。
而企业的资源是有限的,不可能同时解决所有的问题。问题的解决必然有轻重缓急之分。
那么凭什么要先解决转化率的问题,而不是解决引流的问题、留存的问题、活跃度的问题?
数据分析师必须了解企业当前的战略方向,把有限的资源投入到更重要的方向上。
如果上面这两个隐藏的问题不想清楚,就开始分析怎么办,那么这类分析师的工作往往会费力不讨好,做很多低绩效的工作。
技艺理性需要长时间的练习
说到这儿你有没有觉得,分析师的工作和法律工作者非常的像。
法官只看 事实 ,一切都讲证据。
法官需要 标准 ,标准就是法律文本。即使被告的行为看起来多么地不符合社会道德,只要法律没有规定不允许,那么法官就不能认为有罪。
法官 不预设立场 ,法律的原则是无罪推断,任何人在未经证实和判决有罪之前,都视其无罪。
法官要用 演绎 法推断。法官的判决讲究证据链完整。证据链中的链字,就有一环扣一环的含义在其中。很明显就是需要用演绎法来进行分析。
最后律师要 理清当事人的逻辑 ,大部分人是说不清一件事的,当事人在律师的引导下把事情逐渐还原。
法律史上有一个非常著名的故事,可以为我们带来一些启发。
在1608年,英国国王詹姆斯召见了法官,提出一项要求:既然法官只是国王的代理人,国王自然有权直接裁决诉讼案。
但大法官柯克反对说:国王本人不能裁决任何案件。
詹姆斯一世说:“法律以理性为基础,除了法官之外,我和其他人一样具有理性,为什么就不可以裁决诉讼案?”
柯克大法官很聪明,先夸了国王一番:“确实,上帝赋予了陛下卓越的技巧和高超的天赋;”
接着,他又说:
“但陛下对于英格兰本土的法律并没有研究,而涉及陛下之臣民的生命或遗产、或货物、或财富的案件, 不应当由自然的理性,而应当依据技艺理性和法律的判断来决定,而法律是一门需要长时间地学习和历练的技艺 ,只有在此之后,一个人才能对它有所把握。”
这个故事中非常重要的观点就是 “自然理性”不等同于“技艺理性”,而技艺理性是需要长时间的专业练习的。 数据分析也一样。
总结
很多人想要数据分析速成。 他们认为“自然理性”加上“分析工具和方法”就能做好数据分析。 分析工具、分析方法等技能确实可以速成,但是数据分析的能力不是自然理性能够驾驭的。想要做一个好的数据分析师,必须拥有数据分析的思维,这是一种“技艺理性”,有一点反人性,必须花大量的时间训练才能掌握。
如果你学会了很多数据分析的工具和技巧,依然做不好数据分析。建议尝试练习本文提到的思维。要点很简单, 坚持,坚持,坚持。
#专栏作家
三元方差,公众号:三元方差(sanyuanfangcha),人人都是产品经理专栏作家。专注用数据驱动业务增长,擅长数据分析、用户增长。喜欢阅读、思考和创作。
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: