Utiliser le Big Data pour étudier la psychologie

Amazon
Source: Amazon

Il y a beaucoup de discussions sur la valeur des big data pour les entreprises. Par exemple, Amazon compare vos achats et pages vues à ceux d'autres acheteurs et tente de trouver des personnes ayant des intérêts similaires. Ensuite, Amazon suggère des achats de produits que ces gens ont aimé sous l'hypothèse que vous les aimerez aussi bien.

Les big data peuvent-ils être utilisés pour répondre à des questions d'intérêt pour la communauté de recherche en psychologie? Seth Stephens-Davidowitz a exploré cette question avec détails dans son livre fascinant, Everybody Lies .

Ce que j'aime dans le livre de Stephens-Davidowitz, c'est à quel point il est clair à la fois ce que nous pouvons apprendre des données volumineuses et certaines des choses difficiles à utiliser avec succès.

Les données volumineuses sont particulièrement utiles pour répondre à des questions auxquelles les gens pourraient hésiter à répondre dans le cadre d'enquêtes. Souvent, la façon dont les gens interagissent avec les ordinateurs révèle des aspects de leurs intérêts qu'ils n'exprimeraient pas dans une interview ou même dans un sondage anonyme.

Par exemple, Stephens-Davidowitz explore des données liées à l'orientation sexuelle. Il souligne qu'il existe de grandes différences régionales dans le nombre d'hommes qui déclarent être homosexuels. Par exemple, beaucoup plus d'hommes dans le Rhode Island s'identifient comme étant gay dans les enquêtes que les hommes dans le Mississippi. Il se pourrait que les hommes gais se dirigent vers des États plus tolérants, mais il se pourrait aussi que les hommes gais dans des États moins tolérants soient moins susceptibles de répondre honnêtement aux sondages.

Stephens-Davidowitz a utilisé les données de Facebook sur les endroits où les hommes qui se sont identifiés comme homosexuels sont nés et où ils ont déménagé. Il y avait une certaine tendance vers le passage de lieux moins tolérants à plus tolérants. Mais ce mouvement à lui seul n'expliquerait pas les grandes différences régionales observées dans les enquêtes.

Il a ensuite utilisé les données de Google, qui permet de suivre le type de recherches effectuées par les internautes et fournit des informations sur les emplacements de ces recherches. En particulier, il a examiné la proportion de recherches de pornographie visant spécifiquement la pornographie homosexuelle. Environ 5% des recherches de pornographie effectuées par des hommes visaient la pornographie homosexuelle. Cela était vrai dans pratiquement tous les États américains, peu importe la tolérance de l'État. Cela suggère qu'environ 5% de la population masculine est attirée par les hommes et que cela est vrai dans tous les États.

Les données volumineuses peuvent également être utilisées pour répondre à des questions qui pourraient être difficiles ou impossibles à résoudre autrement. Mon exemple préféré dans le livre vient d'une exploration des rêves. Freud a suggéré que les rêves peuvent révéler symboliquement des désirs sexuels inconscients. Une banane ou un concombre dans un rêve, alors, pourrait être un remplaçant pour un pénis.

Il est difficile de réfuter une telle théorie parce que les désirs dont Freud a parlé étaient supposés être inconscients. Cela signifie que même si les gens parlent de leurs rêves, par définition, ils ne peuvent pas savoir ce que signifie le rêve.

Stephens-Davidowitz a pris des données à partir d'une application qui a recueilli des descriptions des rêves des utilisateurs et a regardé les descriptions des rêves et a trouvé tous les aliments qui ont été mentionnés. Il a examiné les facteurs qui prédisent la fréquence d'apparition d'un aliment particulier dans les rêves, puis a constaté que la fréquence à laquelle ces aliments étaient consommés était un bon prédicteur de leur apparence dans les rêves ainsi que de la saveur des aliments.

Donc, il y a des aliments en forme de phallus dans les rêves – comme les concombres et les bananes – mais ils semblent apparaître plus avec la fréquence à laquelle ils sont consommés qu'autre chose. Par exemple, les concombres sont le septième légume le plus populaire dans les rêves, et ils sont aussi le septième légume le plus populaire dans l'ensemble. Cela suggère qu'il n'y a aucune raison de croire qu'une banane dans un rêve est autre chose qu'une banane.

Enfin, Stephens-Davidowitz fait un bon travail d'exploration de certains facteurs qui peuvent rendre l'analyse des données volumineuses peu fiable. Supposons que vous ayez un trait complexe, comme l'intelligence, et que vous vouliez savoir s'il existe des prédicteurs génétiques de l'intelligence. Vous pourriez essayer d'établir des corrélations entre les tests de QI et les gènes des personnes qui subissent ces tests. Maintenant que les scientifiques disposent de données sur les séquences de gènes pour un si grand nombre de personnes, cette analyse a été effectuée plusieurs fois sur plusieurs ensembles de données différents.

Chaque fois que cette analyse a été faite, des gènes particuliers apparaissent comme de bons prédicteurs des scores de QI dans cet ensemble de données. Le problème est que différents gènes sont apparus dans différentes analyses. Cela arrive parce que même si vous avez beaucoup de données si vous avez un grand nombre de prédicteurs potentiels (comme les gènes) et vous avez de nombreuses occasions de remarquer une corrélation qui est juste le résultat d'une variation aléatoire dans cet ensemble de données. En conséquence, si vous entendez un rapport qu'un gène particulier a été trouvé qui prédit certains traits comme l'intelligence, vous devez le traiter avec scepticisme jusqu'à ce qu'il ait été validé sur plusieurs ensembles de données différents.

Les données volumineuses ne remplaceront pas les méthodes traditionnelles de psychologie. En fin de compte, les grandes données nous donnent l'occasion de voir comment les différents aspects de l'environnement sont liés, mais ils ne peuvent pas nous dire quels facteurs causent des comportements particuliers. Pour ce faire, la psychologie doit continuer à faire le genre d'expérimentation qui a été centrale dans le domaine au cours du siècle dernier. Mais, le big data a un grand potentiel d'être un outil important pour comprendre le comportement des gens.

Suis moi sur Twitter.

Et sur Facebook et sur Google+.

Voici des informations sur mon nouveau livre Brain Briefs .

Consultez mes livres Smart Thinking et Habitudes de leadership, et Smart Change .

Écoutez mon émission de radio sur la radio KUT à Austin Deux gars sur votre tête et suivez 2GoYH sur Twitter et sur Facebook. Le spectacle est disponible sur iTunes et Stitcher.