原创 科学家也会出错?73个团队验证同个假设,用同样数据却互相矛盾
创始人
2026-01-10 06:01:37

哈喽,大家好,今天小墨这篇评论,主要来分析科学家也会被偏见绑架,数据证实预期时反而最该警惕

同一张图,不同的人看出不同结论

有个实验挺有意思。研究人员给171个计算机专业的大学生看了同一张数据图,图上是关于财富和幸福值关系的数据点。在看图之前,他们先问这些学生预期两者是什么关系。结果70%的人说应该是正相关,剩下30%说是负相关。

有意思的地方来了。那些预期正相关的学生,得出正相关结论的比例,是预期负相关学生的两倍多。同一张图,预期不同,看出来的东西就不一样。这张图实际上暗藏玄机,总体看是负相关,分年龄组看又是正相关,典型的辛普森悖论。问题是大部分人压根没深究这个矛盾,直接按自己预期给出了答案。

这事不只发生在学生身上。1919年爱丁顿去验证爱因斯坦相对论预言,他带回来的数据其实既能支持爱因斯坦,也能支持牛顿。爱丁顿相信爱因斯坦,所以他发表的论文就说数据支持相对论。

73个团队分析同一组数据,结果天差地别

去年有个研究更夸张。73个专业团队拿到同一组数据,去验证同一个假设。结果各个团队给出的结论差异大到离谱。有的说显著支持,有的说完全不支持,用的明明是一模一样的原始数据。

研究人员最后得出个结论,研究设计的可变性构成了一个庞大的宇宙,这个宇宙通常隐藏在视野之外。说人话就是,数据怎么处理、用什么方法分析,这些选择空间太大了,不同的人做出来的东西完全不一样。

另一个功能磁共振的研究也类似。70个独立团队分析同样的脑成像数据,检验9个假设。没有任何两个团队用的分析流程是一样的,好几个团队基于同一组数据,报告了完全矛盾的统计显著结果。

这些研究说明一个事,数据不会自己说话,得靠人去解释。解释的时候,人的偏见就进来了。你相信什么,你就更容易从数据里看出什么。

发现矛盾才是好事的开始

去年底《自然》上发表了个关于动物胚胎发育的研究。研究团队比较了十个不同门类动物的基因表达,本来预期会看到发育中期的共有模式,结果发现完全相反。不同门类之间,反倒是早期和晚期更相似,中期差异最大。

这个结果跟之前同一个门内部的研究矛盾。研究团队没有硬解释,而是退回去重新思考。最后他们意识到,这两种矛盾的模式其实对应不同的演化时间尺度。门内部看是沙漏形状,门之间看是反沙漏形状。这个矛盾反倒帮他们找到了动物门类的分子定义。

这个案例说明,遇到矛盾不是坏事。问题是很多研究者看到矛盾就绕开了,或者干脆忽略掉不符合预期的那部分数据。心理学把这种倾向叫"确认偏误",就是人天生喜欢找支持自己观点的证据,对反对的证据视而不见。

中世纪那些有害的医疗方法能延续几百年,就是因为只有康复的病人被记住了,死掉的就当没看见。现在很多替代医学也是这个路数,只宣传有效的案例,失败的案例从来不提。

同行评审也逃不开偏见

学术论文的同行评审,按说应该是客观公正的。实际情况是,当研究结果跟评审者自己的假设不符时,这篇文章会遭受更严苛的审查。有研究专门统计过这个现象,评审者对挑战自己观点的论文,要求的证据标准明显更高。

甚至还有科学家把对立论文当作支持自己观点的证据来引用,完全曲解了原文的意思。这种事在学术圈不是个案,是个普遍现象。

临床试验为什么能避开这些问题?因为它们有一整套严格的流程。研究方案必须预先注册,数据设盲,分析方法提前规定好,不能事后调整。这些机制专门用来对抗人的偏见。

基础研究就不一样了。很多时候开始分析数据之前,研究者自己也不知道会得到什么结果。高通量数据集尤其如此,里面包含的信息常常超出预期。这种情况下,如果一开始就有明确假设,反倒可能错过意外的发现。

总结

科学的客观性不是天然存在的,是靠机制和方法保障出来的。承认科学家会有偏见,主动去找数据里的矛盾,才能真正接近真相。遇到矛盾不是失败的信号,是进步的开始。

相关内容

热门资讯

车和家申请充电路径的确定方法专... 国家知识产权局信息显示,北京车和家汽车科技有限公司申请一项名为“充电路径的确定方法、装置、电子设备及...
通威取得晶硅电池、光伏组件和光... 国家知识产权局信息显示,通威太阳能(合肥)有限公司;通威太阳能(安徽)有限公司取得一项名为“一种晶硅...
原创 美... 船箭组合体最快1月17日转移!美国重返月球计划第二步要来了,2028年前完成载人登月,稳定了? 的确...
宇航员在太空中生病了怎么办? 正在国际空间站执行“龙”飞船第11期载人任务的一名宇航员出现健康状况。美国航天局8日表示,决定安排该...
亿纬动力取得一种单体电池及电池... 国家知识产权局信息显示,湖北亿纬动力有限公司取得一项名为“一种单体电池及电池包”的专利,授权公告号C...