Pourquoi les statistiques inférentielles?

Imaginez que nous avions une question: "Les hommes et les femmes diffèrent-ils sur X?"

Peu importe ce que «X» est – la hauteur, l'empathie, la connaissance de l'histoire espagnole du 13 e siècle ou autre – nous savons que tout homme sera différent de n'importe quelle femme, mais nous ne savons pas comment les hommes En moyenne, «nous différons des femmes». C'est-à-dire que lorsque nous avons posé notre question initiale, nous voulions probablement savoir comment la moyenne pour les hommes comparée à la moyenne pour les femmes. Mais nous ne connaîtrons jamais le véritable moyen pour les hommes ou le véritable moyen pour les femmes, car cela impliquerait de mesurer plus de 7 milliards de personnes! Donc, nous devons, d'une façon ou d'une autre, obtenir un échantillon d'hommes et un échantillon de femmes, les comparer et en tirer une conclusion.

Disons que nous obtenons un échantillon de 100 hommes et 100 femmes, et nous leur posons des questions sur l'histoire de l'Espagne. Dans notre échantillon, les femmes ont en moyenne 68% et les hommes 63%. C'est le résultat de notre échantillon et c'est un résultat solide. Mais, rappelez-vous, nous ne sommes pas particulièrement intéressés par notre échantillon – nous nous intéressons aux «hommes contre les femmes», pas aux «hommes que nous avons regardés» par rapport aux «femmes que nous regardions». Nous voulons utiliser notre échantillon pour déduire quelque chose sur la population plus large (et c'est ce qui met l'infère dans les statistiques inférentielles ).

Faire ces inférences a un sérieux défi: toute différence que nous voyons dans nos échantillons pourrait être due au hasard! Bien sûr, notre groupe d'hommes diffère de notre groupe de femmes, mais cela ne nous dit pas grand chose en soi, parce que si nous choisissions au hasard deux groupes d'hommes, ils différeraient aussi. Ceci est un problème sérieux: Étant donné que deux échantillons vont évidemment différer l'un de l'autre sur pratiquement tout ce que nous essayons de mesurer (si nous pouvons mesurer suffisamment en détail), comment pouvons-nous utiliser des échantillons pour tirer des conclusions?

Tout n'est pas perdu, cependant, comme nous le dira une petite intuition. Les différences trouvées en raison de la chance aléatoire sont susceptibles d'être petites, et sont susceptibles d'être d'une taille très différente si nous refaisons le même test. Si nous pouvions répéter notre test encore et encore (avec de nouveaux échantillons), cela nous aiderait à faire de meilleures inférences: si nous avions des échantillons de 100 hommes et 100 femmes 20 fois, et chaque fois que nous trouvions des femmes 5 points plus élevées que les hommes, serait beaucoup plus confiant dans notre conclusion. Alors que la réplication n'est généralement pas pratique, nous pouvons utiliser un échantillon pour deviner ce qui se passerait si nous répliquions. Et, notre intuition peut nous aider ici aussi: Si nous trouvons une petite différence entre les groupes après avoir mesuré seulement un petit nombre de personnes, cela est plus susceptible d'être dû au hasard que si nous trouvons une grande différence entre les groupes après avoir mesuré un beaucoup de gens. Rompre cela: 1) Les grandes différences sont moins susceptibles d'être dues au hasard que les petites différences, et 2) plus la taille de l'échantillon est grande, plus le point 1 est vrai.

Si nous pouvions avoir une bonne idée mathématique de la partie «moins probable» ou «plus probable» de ces affirmations, nous pourrions commencer à utiliser nos échantillons pour faire de très bonnes suppositions quant à la reproductibilité de nos résultats. Autrement dit, nous pourrions utiliser notre échantillon unique pour prédire de manière fiable ce qui se passerait si nous reproduisions notre étude plusieurs fois. Nous avons déjà convenu plus haut que si le résultat se reproduisait encore et encore, nous serions sûrs de tirer des conclusions sur l'ensemble de la population. Et maintenant nous savons que nous pouvons utiliser un seul échantillon pour tirer des conclusions sur ce qui se passerait si nous avions beaucoup d'échantillons. Mettre les deux dernières phrases ensemble: Si nous pouvions avoir des maths derrière nous, nous pouvons utiliser notre échantillon unique pour faire des inférences fiables sur la population plus large.

Ainsi, quelle que soit la statistique inférentielle que nous utilisons, la question est toujours quelque chose comme: "Cette différence nous avons trouvé dans notre échantillon, quelle est la probabilité que nous trouvions une différence aussi grande, juste par hasard?" est dû au hasard, nous sommes confiants que c'est réel.