幸存者偏差,另译为“生存者偏差”或“存活者偏差”,是一种常见的逻辑谬误(“谬误”而不是“偏差”),意思是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。这东西的别名有很多,比如“沉默的数据”、“死人不会说话”等等。
“幸存者偏差”在日常生活中十分常见,比如很多人得出“读书无用”的结论,是因为看到有些人“没有好好上学却仍然当老板、赚大钱”,却忽略了那些因为没有好好上学而默默无闻,甚至失魂落魄的人;很多人在看了经典的老电影后,会感叹电影创作“今不如昔”“一年比一年差”,却忽略了那些淘汰在时光中的、不好看的老电影……
幸存者偏差的起源和案例
关于幸存者偏差(Survivorship Bias),有一个较知名的“飞机防护”案例。
1941年,第二次世界大战中,美国哥伦比亚大学统计学沃德教授(Abraham Wald)应军方要求,利用其在统计方面的专业知识来提供关于《飞机应该如何加强防护,才能降低被炮火击落的几率》的相关建议。
沃德教授针对联军的轰炸机遭受攻击后的数据,进行研究后发现:机翼是最容易被击中的位置,机尾则是最少被击中的位置。沃德教授的结论是“我们应该强化机尾的防护”,而军方指挥官认为“应该加强机翼的防护,因为这是最容易被击中的位置”。
沃德教授坚持认为:
(1)统计的样本,只涵盖平安返回的轰炸机;
(2)被多次击中机翼的轰炸机,似乎还是能够安全返航;
(3)而在机尾的位置,很少发现弹孔的原因并非真的不会中弹,而是一旦中弹,其安全返航的概率就微乎其微。
军方采用了教授的建议,并且后来证实该决策是正确的,看不见的弹痕却最致命!
这个故事有两个启示:一是战死或被俘的飞行员无法发表意见,所以弹痕数据的来源本身就有严重的偏误;二是作战经验丰富的飞行员的专业意见也不一定能提升决策的质量,因为这些飞行员大多是机翼中弹而机尾未中弹的幸存者。
幸存者偏差在营销中的应用
幸存者偏差的本质就是选择偏倚。
1.关于用户反馈
类比到互联网行业中,目标市场的每一个潜在用户都是一架飞机。
然后,每一个节点,包括但不仅限于一条糟糕的广告、一次不畅的沟通、一场流于形式的会议,都会是一枚枚子弹。
而穿越了层层阻碍成功注册使用你的产品的用户,就是安全飞回来的飞机。那么,你收集到的反馈来自哪里?答案已经不言自明。你最容易得到反馈的人,恰恰是经常使用产品的人。
你最能知晓的产品问题,都是那些打在非致命伤上的弹孔而已。
当然,对于一个成熟的产品,用户量足够(飞回来的飞机够多)可以不用过于担心流失的用户,直接定义为非用户群即可。
但是对于一个新生的产品,这就是个大问题了。
我应该在哪里加强我的装甲,我如何把有限的资源进行更优配置?幸存者偏差直接影响的就是新产品的功能迭代。
功能迭代一般都从最容易收集到反馈的用户那里获得。通过询问 the current top users 最希望在产品中看到哪些改进,从而构建新功能。但是,这可能完全忽略了目标市场中那部分没有给你任何数据的人对你的产品不感兴趣的原因。就像被击落的飞机无法告诉你它是怎么死的。
2.Facebook视频广告案例
2016年9月年Facebook关于视频广告数据偏差的问题变成了该公司广告历史上不大不小的负面新闻,Facebook在其官方博客中承认:其提交给广告主的数据报告中,视频广告平均播放时长的数字只统计了那些播放时长超过3秒的播放行为,也就是说,如果视频播放没超过3秒,Facebook居然就把它舍去了,很显然,广告主的平均播放时长被拉长了,因为播放时间短的压根不统计,而这一偏差居然存在了长达两年之久。
这个案例中,分析依然分为三步:
判断样本随机性——
判断样本和剩余样本是否存在显著差异?
分析剩余样本数据、验证结论。