想成为数据产品经理,先掌握这些数据分析方法论(二)
之前在《想成为数据产品经理,先掌握这些数据分析方法论》一文中,分享了一些基础的数据分析方法,从业务分析、用户分析和产品运营三个方面提供了一些分析的切入角度。接下来,进阶一步,我们再来看看还有哪些实用的分析工具。
一、业务分析:如何做诊断归因?
在《想成为数据产品经理,先掌握这些数据分析方法论》一文中分享过杜邦分析法,杜邦分析法是财务中常用的拆解指标的方法,可以将核心指标拆解为多个因素乘积的形式,如GMV=访客数转化率客单价。
在做完指标拆解后,应该如何进行进一步归因呢?本月GMV上涨了,是访客数增长的贡献还是转化率上升的结果,抑或是因为客单价的提升?
为此,我们需要引入另一个在财务领域广泛应用的分析方法——因素分析法。
1. 因素分析法是什么?
因素分析法是在将核心指标拆解为多个因素后,识别各因素对核心指标影响程度的一种方法。
我们将指标拆解后,当然,可以用控制变量法来计算每个因素的贡献,比如,假设上月的GMV、访客数、转化率、客单价分别为GMV0、V0、T0、M0,本月的GMV、访客数、转化率、客单价分别为GMV1、V1、T1、M1,那么
GMV0=V0T0M0
GMV1=V1T1M1
我们要判断访客数,也即流量的贡献,按照控制变量法,假设转化率和客单价与上月一样,访客数变化所带来的GMV提升为:
Attr_V=V1T0M0- V0T0M0
同样,计算转化率贡献的公式为:
Attr_T=V0T1M0- V0T0M0
这里用到的是传统的控制变量的思想,但要使用控制变量法需注意一个前提,那就是各个变量之间要相对独立,但真实情况下,各个因素之间都是相互影响的,很难保证独立性。
而因素分析法所采用的是连续替代的方法,在计算下一个因素的贡献时,会考虑到上一个因素的变化,可以有效地规避控制变量法中不独立的问题,我们具体看一下如何操作。
首先,我们在上月GMV0的基础上,用本月的访客数V1替换V0,接着再依次用T1替换T0,M1替代M0,可以得到:
上月GMV:GMV0=V0T0M0 ①
第一次替代V:V1T0M0 ②
第二次替代T:V1T1M0 ③
第三次替代M:V1T1M1 ④
而每一次替代前后的变化,就是对应因素的贡献值,即:
Attr_V=②-①
Attr_T=③-②
Attr_M=④-③
GMV1-GMV0= AttrV+ AttrT+ Attr_M
2. 举个栗子
下面,我们举个实际的例子来熟悉一下上述方法。
假设9月和10月的数据如下:
那么,用因素分析法依次替代后的结果如下:
9月GMV:GMV0=V0T0M0=12w ①
第一次替代V:V1T0M0=151%60=9w ②
第二次替代T:V1T1M0=152%60=18w ③
第三次替代M:V1T1M1=152%70=21w ④
各因素的贡献率分别为:
Attr_V=②-①=9-12=-3w
Attr_T=③-②=18-9=9w
Attr_M=④-③=21-18=3w
由此可见,10月的访客数较上月有所减少,导致了3w元GMV的流失,但流量显然更精准,转化率明显提升,且转化率的贡献最大,带来了9w元的GMV增量,此外,流量质量也较高,客单价有所上涨,带来了3w元的GMV提升。
因此,后续应该加强流量的引入,转化率可以分渠道进一步分析,针对高转化率的渠道进行重点运营,而客单价可以进一步分析是产品价格提升了,还是用户买的产品数量更多了。
因素分析法的作用,就在于可以找到关键的正向或负向因素,当精力或资源有限时,可以有的放矢,重点解决关键问题。
3. 替代顺序如何确定?
看到这里,不知道大家有没有发现,如果改变一下替代的顺序,各因素的贡献值会发生变化,比如,如果先替换客单价,那客单价的贡献值肯定跟上面的结果有所差异。
那么,我们应该如何保证因素分析法的有效性呢?
因素分析法是建立在某种前置假设的逻辑之下的,既然无法将各因素割裂进行分析,那么就依次考虑各因素的叠加效应,而这个次序需要遵循实际经济意义上的先后逻辑。
比如,以上述的访客数、转化率和客单价为例,自然是先有访客到访浏览,才会有下单转化,之后才会产生交易金额。也即先得有人来,来了才会决定买不买,决定买了再看花多少钱买。
同样,如果我们把GMV拆成价格*销量,那么应该先考虑价格的贡献,再计算销量的贡献,因为是先定价,才会有销量,而且销量很大程度会受到价格的影响。
二、用户分析:如何分析品牌认知差异?
网络社交媒体和电商平台中沉淀着大量的用户反馈信息,通过舆情的挖掘分析,可以为品牌商提供多角度的参考建议,指导品牌商进行产品或服务的优化。
很多品牌商都会定期找调研公司进行调研,从而了解用户对品牌的认知,以指导下一阶段的品牌形象建设或品牌差异化策略。
有很多调研的分析方法同样适用于舆情的分析,接下来就分享其中的一种——对应分析。
对应分析(Correspondence analysis)也称关联分析,是一种多元相依变量统计分析技术,是通过分析由定性变量构成的交互汇总表来揭示变量间的联系。
简单来讲,其实就是先将各类变量放到一起进行相关性分析,把关联度高的进行归类,达到降维的效果,如将为二维(两个分类),接着,再看各变量在这个二维空间中的位置,最终判断变量间的关联性。
对应分析与因子分析的差异,就在于因子分析是针对一个变量中的值进行归类,看的是相同变量的相似性,如老鹰和麻雀都可归为鸟类,而对应分析包括多个变量,还能看不同变量的关联性,如老鹰(鸟类)与食物(鼠)的关联度高,麻雀(鸟类)与谷类(食物)关联度更高。
对应分析的具体原理在此不做赘述,大家感兴趣的话可以上网查阅,接下来,我们看一看实际的例子(数据都是我编的,如有雷同,应该是抄我的)。
1. 基础入门:简单对应分析
现在,假如我们将用户的评论、反馈数据,通过切词、归类编码后,得到以下数据表:
简单对应分析适用于两个变量交叉分析,我们先选“品牌”和“认知”这两个变量来进行对应分析。
在很多分析工具中都有对应分析的功能或程序包,我们以SPSS为例,在SPSS菜单中选择【分析】-【降维】-【对应分析】,选择行列分别为“品牌”和“认知”,可以得到以下摘要表:
我们看到显著性sig=0.000<0.01,卡方检验通过。
然后,观察第一列“维”(也就是所谓的归类)和后面的累积惯量比例,可以看到维1和维2加起来的累积惯量比例已经达到99.5%,也即用这两个维度已经可以解释“品牌”和“认知”这两个变量中99.5%的信息。
接着,我们可以得到具体类别在这两个维度上的得分,生成对应分析图如下:
通过对应分析图分析关联性目前有多种方法,如向量分析、理想点与反理想点等。
这里我们用最简单的观察法进行定位分析,首先标出几个品牌的位置,然后观察品牌认知的形象词与品牌的距离,距离越近,说明关联程度越高。
至此,我们可以大致判断出各品牌在消费者心目中的形象。
2. 进阶拓展:多元对应分析
简单对应分析比较直观,但其缺点在于只能分析两个变量。如果我们除了分析品牌形象以外,还想看看各类型用户对于品牌认知的差异,那么就需要用到多元对应分析。
在SPSS菜单中选择【分析】-【降维】-【最优尺度】,选择分析变量为性别、年龄、品牌、认知,最终生成结果如下:
从图中可以看到,50岁以上女性更偏好悠悠诗,她们觉得悠悠诗是“高端的”。40-50岁人群更偏好星七克和雀窝。
多元对应分析的信息量相对较大,可以得到更丰富的解读,但理解较为困难,可酌情选用适宜的方式进行分析。
三、产品运营:如何评估产品功能价值?
之前的文章中讲到了评估产品使用广度、深度和粘性的指标,用来监控产品当前的使用状况。
但该方法只能适用于产品上线之后的效果评估,而在实际工作中,产品经理们还经常遇到另一类更为频繁且棘手的问题,那就是——没有资源,排不上期!
需求总是呈井喷之势,而资源始终是挤牙膏状态,产品经理平日做的最多的事就是进行需求评估,通过形(pai)而(nao)上(dai)的方法,将需求拍出,额,不对,排出优先级。
那么问题来了,我们应该怎样进行优先级的评估呢?
同样,我们可以向传统调研取取经,接下来,就跟大家分享一个方法——Kano模型。
1. 理论基础——双因素理论
在讲Kano模型之前,我们先熟悉一下这个模型的理论依据。
了解过组织行为学的同学对双因素理论肯定不会陌生,双因素即“保健因素”与“激励因素”,美国行为科学家赫茨伯格认为,满意的对立面并非不满意,而是没有很满意,而不满意的对立面也不是满意,而是没有不满意。
一段绕口令后,我们举个实际的例子,公司福利、公司政策、工作环境,这些因素容易引起员工的不满,但如果满足了这些基本条件,员工就会满意了吗?
这些在员工看来只是基本的“保健因素”,就像每天都能吃饱并不能使我们幸福一样,而个人成就、社会认同、个人成长,才是能给员工带来满足感的“激励因素”。
赫茨伯格认为“保健因素”来自于外部环境,而“激励因素”是一种内在激励,马斯洛底层的生理、安全和感情需要都可以认为是“保健因素”,而自我实现等高层需求属于“激励因素”。
说白了,放到产品的语境下,就是有的功能是必需的,但不能让用户爽,而有的功能真的可以让用户感到爽,激发用户的“Aha Moment”。
2. 研究方法——Kano模型
Kano模型的底层逻辑和双因素理论一样,在做问卷调研时,一般会问正向和负向向两个问题,即:
- 正向:有这个功能,你的态度
- 负向:去掉这个功能,你的态度
依照此方法,对于每一个功能,我们都可以收集并汇总统计用户的态度数据。
基于上面的数据统计,可以进一步计算出Better-Worse系数,表示该功能可以增加满意/消除不满意的程度。
增加后的满意系数 :(A+O)/(A+O+M+I)
消除后的不满意系数 : -1*(O+M)/(A+O+M+I)
我们将所有功能的Better-Worse系数放到一张图上,就可以对功能进行归类分析了。以手机为例,构建假数据制图如下:
- 魅力因素:非必要需求,但可以给用户意外惊喜。
- 期望因素:用户很期望被满足的需求,没被满足的话会很失望。
- 必备因素:必要的基础需求,有的话很正常,但绝不能没有。
- 无差异因素:用户不太在乎,有没有都无所谓。
通过象限图我们可以看到,双屏可折叠等黑科技非常吸人眼球,虽然不是必需的,但却可以大大提升满意度。
AI摄影、超长待机等功能属于期望因素,跟用户的满意度有很大关系,所以很多手机品牌商不断在摄影功能、待机时长上做文章。
高性能处理器、大尺寸、指纹识别已经逐渐成为必备因素,这与行业的教育引导有关,当大家都习惯了用手机打游戏、看视频,高性能、大尺寸自然会成为必要条件。
还有一些功能虽也有所创新,但比较鸡肋,用户不太关注,如type-c接口、无线快充。
Kano模型比较适用于产品的需求调研,无论是前端产品还是后端产品,先可基于定性访谈收集需求,再收敛需求进行定量调研。
针对期望因素和必备因素,需要重点维护及迭代优化,而魅力因素属于亮点功能,有时间精力可以逐步加大投入。对于无差异因素,应当减少维护和运营的成本,甚至将功能下架。
每个功能所处的位置并不是静态的,甚至往往会随着时间推移发生很大的变化,就跟产品都有生命周期一样,功能也会有自己的生命周期,定期运用Kano模型进行产品功能分析,可以帮助我们掌握需求变化,从而指导下一阶段的产品升级。
#专栏作家
Mr.墨叽,公众号:墨叽说数据产品,人人都是产品经理专栏作家。电商行业资深产品经理,擅长策略构建,数据分析。
本文原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: