(NDL : Certaines des expériences citées ici, que ce soit celle de Milgram, sur la soumission à l’autorité, de Zimbardo, à Stanford, ou la menace du stéréotype sont des expériences célèbres qui ont été instrumentalisées dans le débat politique. Il est donc important de souligner leur manque de solidité expérimentale.)
Ces dernières années, la psychologie a accumulé les rétractations : en fait, seuls 40 à 65 % des résultats classiques en psychologie sociale ont été reproduits (…). (Et même parmi celles qui ont été répliquées, l’effet moyen trouvé était la moitié de l’effet initialement rapporté). Ces erreurs sont beaucoup moins coûteuses pour la société que les erreurs médicales, mais elles viennent troubler largement le débat, qu’il nous faut éclaircir.
La psychologie n’est pas unique dans ce cas : la médecine, l’oncologie et l’économie ont toutes de nombreux résultats impossibles à répliquer. Pour autant, ce serait une erreur d’écarter le champ de la psychologie : nous connaissons la plupart des problèmes grâce aux psychologues, et ses sous-domaines diffèrent beaucoup par le taux de réplication et la réduction de la taille de l’effet.
(…)
Ce qui suit sont des constats empiriques sur des résultats empiriques, susceptibles d’être rétractés également. Par ailleurs, on ne peut pas dire que ces résultats soient erronés : les réplications ratées (ou les preuves de fraude) ne font généralement que remettre en question les preuves d’une hypothèse, mais ne disent pas que l’hypothèse opposée serait vraie.
Psychologie Sociale
(…)
Pas de preuve solide pour l’expérience de la prison de Stanford. Ce n’était pas une expérience : (…) Comme Zimbardo l’a concédé, ils avaient commencé à travailler sans hypothèses.
Pas de preuve solide de la fameuse expérience de Milgram que 65% d’une population pourrait faire du mal à un homme si on leur en donnait l’ordre. (…) Seulement la moitié des cobayes croyait vraiment que l’expérience était réelle, et parmi ceux-ci, 66% ont désobéi aux ordres.
Pas de preuve solide que des tribus émergent spontanément suivant des distinctions arbitraires et mènent à la violence entre groupes. Le conflit « spontané » entre les enfants de la caverne aux voleurs était orchestré par les organisateurs sur un petit échantillon (…).
(…)
Efficacité très faible du test d’association implicite pour détecter le racisme. Les notes des biais implicites ont un très faible effet prédictif sur des biais réels.
(…)
Au mieux, très faible preuve qu’une menace du stéréotype féminin diminuerait le score des femmes en maths. Cette étude vérifie les interactions entre sexe et stéréotype.
(…)
Les effets des nudges sont généralement exagérés. Une méta-étude sur le sujet a trouvé que les effets réels étaient six fois moindre que ceux estimés (mais ceux-ci demeurent réels).
Gleech (en anglais)