数据和目的

yifen 关于数据分析的看法

我在微博上看到有人转了这么一条。 内容大概是说,中西医结合的治疗方案可以大幅降低死亡率。引用的文章里,中西医结合的死亡率是 8.8%,纯西医组的死亡率是 46.2%。这条微博是来驳斥这种不靠谱的结论的——先不说中医在治疗武汉肺炎上是否靠谱,这样不严格的对照组得出来的这个数据是没有说服力的。

过一会儿在豆瓣上看到了同一件事的另一个说法

image.png

武汉肺炎整体的病死率是 4.28%,而这个中西医结合的病死率高达8.8%。光从这条广播列举的两个数字来看,中西医结合的治疗方法简直就是在杀人了。

明明是客观事实的数字放在那里,但在不同的人眼中看来,就可以挑选自己喜欢的数字,辅助表达符合各自看法的观点。这种事情太常见了。而且发生了这种事情的时候,很难通过跟对方讲道理来说服对方。可能对方确实就是发自心底地就这么认为了,这种先入为主的自我暗示是非常强大的,偏要去说服对方反而费力不讨好。

还有一种情况是:对方其实也知道这么得出结论是不对的。但为了某一种目的,他必须要坚持这样的观点,不然就没办法讲完自己想说的话了。这种情况下,目的已经超过了客观理性,想要说服对方更是不可能。

我想起了我在工作中也会遇到这样的情况。产品经理推出了一个不那么好的需求,出发点是觉得这个需求可以实现某个目的。等到了需求上线后,产品经理用不严谨的数字得出来了符合他出发点的结论,并且跟老板表明了这个需求确实有效果。我不是在怀疑自己的同事经常使用这样的小伎俩,但确实有那么一两次,在同样的数字面前,我感觉是很难得出来那么明显的结论的,但产品已经可以用这样的东西来作为自己的成绩了。这种情况下,也就不大好去跟别人明辨是非了。

我觉得会出现这样的现象,自己的工作中会有这样的行为,根本原因还是因为:负责得出结论的人有自己的立场。有了立场就很难在总结的时候尽量客观,得出来的结论就很容易有失偏颇。

要解决这样的问题,可能还是需要找专门负责做数据分析的同事来分析数据,最后得出结论才行。那条微博也一样:希望能把最原始的数据都发出来,对照组里各个病患的身体状况也应该尽量交代清楚,不要替大家总结陈词,而是交给大家去得出来结论。

我又想起来一个小故事,说是一个房间里有六个人,每天吃饭的时候有人负责分食物,但分食物的人总是会给自己分多一点,别人碗里的就少一点。后来他们想了一个好办法,能让每次吃饭的时候都吃到差不多均匀分量的食物了:还是交给一个人来分食物,但他们定了一条新规矩,分食物的人,要在最后挑选食物的碗。假如分食物的人分配不均,那么最后选择碗的他只能挑别人挑剩下的、最少的那个碗了。

我知道生活中人是总会有自己的出发点的,也很难总去期待交给某个人来主持公道。但我希望大家都能克制自己,不要故意去做坏事,不要为了自己的利益故意去误导别人。自己碗里的食物是多了,但总会有人会拿到食物最少的那个碗。对他人的同理心就是一种善良。

最后分享一个刷推特看到的跟数据统计有关的网站。希望自己能多学习一些知识,看到数据的时候不要被别人的结论迷惑。