Corrélations parasites par Tyler Vigen: une revue de livre

Le livre de Tyler Vigen, Spurious Correlations , est chaleureux, drôle et fait plusieurs points très importants. Selon Vigen, son livre est basé sur des dizaines de corrélations entre des ensembles de données complètement indépendants. Il s'est appuyé sur un ordinateur pour générer des corrélations aléatoires entre les produits de Pearson (r) entre des variables sans signification telles que l'inscription à l'école secondaire publique et la consommation de crème sure. Et en fait, la corrélation entre les inscriptions dans les écoles secondaires publiques et la consommation de crème sure est assez élevée, r = .95. Non seulement cela est aléatoire et dénué de sens, mais le plus gros problème est que nous voyons chaque jour un non-sens comme celui-ci et que les gens fondent leurs conclusions sur ces corrélations. Par exemple, je suis préoccupé par l'inscription à l'école. Est-ce que cette forte corrélation signifie que si je mange plus de crème sure, plus d'enfants resteront à l'école?

Le livre de Vigen est très amusant parce qu'il a près de deux cents de ces corrélations stupides et aléatoires qui sont dérivées de bases de données sérieuses. Par exemple, lorsque les données du Center for Disease Control, CDC, sont corrélées avec les données de la base de données Internet Movie, il a trouvé que les apparences de Ben Affleck ont ​​une très forte corrélation avec les empoisonnements accidentels par les pesticides, r = .92. Est-ce que cela signifie que les films de Ben Affleck provoquent des empoisonnements accidentels par les pesticides? Bien sûr que non. Comme tout le monde de la psychologie de premier cycle le sait, la corrélation n'implique pas la causalité. Une corrélation est simplement une relation mathématique entre deux ensembles de données. Cela signifie que deux variables vont ensemble ou covary.

Bien que amusant et stupide, ce livre démontre de nombreux principes importants. Avec 1) soyez prudent dans votre interprétation des données et 2) la corrélation n'implique pas la causalité est le troisième concept de la corrélation parasite. En fait, le livre de Vigen s'intitule Spurious Correlations. Strictement parlant, une corrélation fausse est quand la relation entre les variables avec une forte corrélation est expliquée par une troisième variable. C'est ici que le livre de Vigen devient encore plus intéressant. Voici un autre exemple. Les recettes publicitaires de March Madness TV et Breweries aux États-Unis sont corrélées .94. Alors que les revenus publicitaires augmentent, les brasseries aussi. Pourraient-ils tous deux s'expliquer par une économie en plein essor? Une meilleure économie conduit à plus d'argent à dépenser sur tout, y compris les publicités télévisées et les brasseries. Et ceci suggère un autre principe de science sociale, la loi de parcimonie. La Loi de parcimonie soutient que lorsque les choses sont ambiguës, l'explication la plus simple qui explique le plus d'observations est la meilleure.

Hmmm …., Maintenant les choses deviennent complexes. Il ne suffit pas d'observer une relation corrélationnelle entre les variables et de sauter à une conclusion. Malheureusement, cela arrive tout le temps et c'est pourquoi ce livre est un très bon complément à une classe formelle en statistiques. Quoi qu'il en soit, il devient évident que les sciences sociales concernent le raisonnement, la logique et pas seulement les corrélations générées par ordinateur. Nous utilisons le raisonnement déductif pour former des hypothèses, un raisonnement inductif pour tester les hypothèses, et reproduire soigneusement nos conclusions avant de sauter aux conclusions. La recherche en sciences sociales est fondamentalement un exercice de logique. Malheureusement, à l'ère du Big Data, cela ne se passe pas assez. Chaque jour, nous sommes submergés de données. Je ne peux même pas manger un chocolat de Sees sans savoir combien de calories cela me coûtera. Les scientifiques font la course pour publier les résultats et les résultats négatifs ne sont même pas publiés. Les médias et les enseignants saisissent la conclusion la plus rapide et la répandent comme des ragots ou des enfants qui jouent au téléphone. Tout se passe très rapidement sans beaucoup de réflexion critique ou d'examen. Et, c'est exactement pourquoi le livre de Vigen est si important. En se moquant de corrélations insignifiantes, il attire l'attention sur la pensée bâclée. Lisez ce livre pour le plaisir, puis arrêtez-vous et pensez aux implications pour toutes les conclusions insignifiantes que nous formons tous les jours.