可重复危机是心理学的危机,还是心理学研究方法的危机?

COS组织的大规模重复性实验,100项只有39项可重复。
关注者
96
被浏览
16,414

7 个回答

一枚普通的心理学爱好者的看法。

所谓可重复性危机,根本不是方法的危机,而是权威的危机。原来权威们把持朝政,指鹿为马,而现在新贵们上来了,打了他们的脸。


读一下这篇专栏

然后你会发现:可重复性危机不是由方法本身引起来的,而是对权威“造假”(对数据行进了一些选择)的清洗,因为在验证的时候,在重复的时候,依然使用了“实验+统计”的方法。这说明不是方法本身的错误


再读读这篇文章

和这篇文章

你会发现:贝叶斯学派和频率学派,根本上并不对立,是各有所长的,是可以相互借鉴的。

而且可重复性危机和属于贝叶斯学派或频率学派中的哪个学派,好像没有直接关系。也就是说,并不是由于我使用了频率学派的方法,而导致了不可重复。好像也不是贝叶斯学派就不要求重复。

所以,综上:

大拿们关注的可重复性危机,是一次大规模的打假运动。即,由于“造假”,或者说,由于研究方法的不够严谨,导致了心理学的基石不够稳定,基石不稳导致了体系的危机。所以,现在要重新,按照严谨的方法(还是“实验+统计”的那套),夯实基础,重建体系。

普通爱好者关注的可重复性危机,是“心理学是什么”,该不该用“实验+统计”的方法,研究心理学。

PS:我个人的观点,还是应该坚持“实验+统计”的方法,还是应该依靠数学和科学,不然可能连“危机”都发现不了。

看到了最近很关注的问题,来强行装个逼。

对于可重复性遭质疑的问题,主要是由于心理学期刊过于强调p值(显著性)的重要性造成的,举个例子,同样是研究同一课题的两个研究,一个研究是p<0.05而另一个是p<0.001,往往后者更容易被采纳。但是,这就导致了一个问题,前者的p<0.05可能是基于合理的实验设计和抽样得来的,而后者可能只是因为样本量很大,导致任何小的差异都会被视为p<0.001。后者的大样本会使得差异本身是否存在成为了一个受质疑的话题,所以当进行重复实验的时候,不同的样本就有可能出现不同的结果。所以针对这个问题,心理学家提出了两个解决方案,第一个是报告p值的同时也报告效果量,因为效果量本身跟样本数无关,所以可以很好的甄别大样本小差异却显著的情况;第二个就是贝叶斯统计,听我们统计老师说,现在认知方面已经逐渐用贝叶斯统计代替频率派统计了,之前不用是因为计算太麻烦,但是现在计算机发达了,贝叶斯就牛逼了。

其次,我们老师还开了一下脑洞,说可以建立一个不显著实验库,这样就可以保留那些不被重视的不显著的结果,进而避免出现对于显著性的偏好。

其实叭,心理学还很年轻呐,感觉很多理论都只是雏形,需要革新的实验方法才能推动整个学科的发展呢。