Importance dans les statistiques - Enquêtes - Quelle est l'importance, la signification de la statistique

Première partie: Quelle est la signification statistique?

Les niveaux de signification vous montrent comment probablement un modèle dans vos données est due au hasard. Le niveau le plus commun, utilisé pour signifier quelque chose est assez bon pour être cru, est .95. Cela signifie que le résultat a une probabilité de 95% d'être vrai. Cependant, cette valeur est également utilisée de manière trompeuse. Non package statistique vous montrera « 95% » ou » .95" pour indiquer ce niveau. Au lieu de cela il vous montrera « .05 », ce qui signifie que la constatation a une chance de ne pas être vrai, ce qui est l'inverse d'une probabilité de 95% cinq pour cent (.05) d'être vrai. Pour trouver le niveau de signification, il faut soustraire le nombre indiqué d'un. Par exemple, une valeur de » .01" signifie qu'il ya une chance de 99% (1-.01 = .99) de celui-ci étant vrai. Dans ce tableau, il n'y a probablement pas de différence dans les achats d'essence X par des personnes dans le centre-ville et la banlieue, parce que la probabilité est 0,795 (à savoir il y a seulement une chance de 20,5% que la différence est vrai). En revanche, le haut niveau de signification pour le type de véhicule (ou .001 99,9%) indique qu'il est presque certainement une vraie différence dans les achats de Brand X par les propriétaires de différents véhicules de la population à partir de laquelle l'échantillon a été prélevé.

Le système d'arpentage utilise les niveaux de signification avec plusieurs statistiques. Dans tous les cas, la valeur p vous indique la probabilité que quelque chose est d'être pas vrai. Si un test du chi carré montre la probabilité de .04, cela signifie qu'il ya un 96% (1-.04 = 0,96) chance que les réponses données par différents groupes dans une bannière sont vraiment différentes. Si un test t indique une probabilité de .07, cela signifie qu'il ya une chance de 93% que les deux moyens comparés serait vraiment différent si vous avez regardé l'ensemble de la population.

Les gens pensent parfois que le niveau de 95% est sacré quand on regarde les niveaux de signification. Si un test montre une probabilité .06, cela signifie qu'il a une chance de 94% d'être vrai. Vous ne pouvez pas être aussi sûr comme si elle avait une chance de 95% d'être vrai, mais les chances sont encore qu'il est vrai. Le niveau de 95% provient de publications universitaires, où une théorie doit généralement avoir au moins 95% de chances d'être vrai à considérer les gens au sujet mérite d'être racontée. Dans le monde des affaires si quelque chose a une chance de 90% d'être vrai (probabilité = 0,1), il ne peut pas être considéré comme prouvé, mais il est probablement préférable d'agir comme si elle était vrai plutôt que faux.

Si vous faites un grand nombre de tests, des résultats faussement importants sont un problème. Rappelez-vous qu'une probabilité de 95% de quelque chose qui est vrai signifie qu'il ya une chance de 5% de celui-ci étant faux. Cela signifie que sur 100 tests qui montrent des résultats significatifs au niveau de 95%, les chances sont que cinq d'entre eux le font à tort. Si vous avez pris un tout à fait aléatoire, ensemble de données et de sens fait 100 tests de signification, les chances sont que cinq tests seraient faussement rapportés importants. Comme vous pouvez le voir, les autres tests que vous faites, plus d'un problème des faux positifs. Vous ne pouvez pas dire que les faux résultats sont - vous savez qu'ils sont là.

La limitation du nombre de tests à un petit groupe choisi avant que les données collectées sont un moyen de réduire le problème. Si ce n'est pas pratique, il existe d'autres moyens de résoudre ce problème. La meilleure approche d'un point de vue statistique est de répéter l'étude et voir si vous obtenez les mêmes résultats. Si quelque chose est statistiquement significative dans deux études distinctes, il est probablement vrai. Dans la vraie vie, il est généralement pas pratique de répéter une enquête, mais vous pouvez utiliser la technique « moitiés séparées » de diviser votre échantillon au hasard en deux moitiés et faire les tests sur chacun. Si quelque chose est important dans les deux moitiés, il est probablement vrai. Le principal problème avec cette technique est que lorsque vous réduire de moitié la taille de l'échantillon, une différence doit être plus grande pour être statistiquement significative.

En termes statistiques, significative ne signifie pas nécessairement importante.
Les valeurs de probabilité doit être lu dans le sens inverse (1 - p).
Trop de tests de signification se tourneront quelques relations importantes à tort.
Vérifiez votre procédure d'échantillonnage pour éviter les biais.

Deuxième partie - La signification exacte des numéros de signification statistique

Malheureusement, les numéros de signification statistique ne nous disent pas directement exactement ce que nous voulons savoir. Ils nous disent quelle est la probabilité que nous serions d'obtenir des différences entre les groupes de notre échantillon qui sont aussi grandes ou plus grandes que celles que nous voyons, s'il n'y avait pas de différence entre les groupes correspondants dans la population représentée par notre échantillon. En d'autres termes, ces chiffres nous disent quelle est la probabilité de nos données, compte tenu de l'hypothèse qu'il n'y a pas de différence dans la population. Ce que nous voulons savoir quelle est la probabilité qu'il existe des différences dans la population, compte tenu de nos données.

Logiquement, si nous sommes suffisamment peu de chances d'obtenir une différence trouvée dans notre échantillon, s'il n'y avait pas de différence dans la population, alors il est probable qu'il y ait une différence dans la population. Nous avons utilisé cette logique dans la première partie de cet article lorsque nous avons dit que vous pouvez interpréter les numéros de signification en considérant 1-p comme la probabilité qu'il y ait une différence dans la population (où p est le nombre de signification produite par le programme). Par exemple, si le niveau de signification est .05 alors vous pourriez envisager la probabilité qu'il y ait une différence dans la population à 95% (1-.05).

Bien que cette logique passe le test de bon sens, les mathématiques derrière la signification statistique ne garantissent pas en fait que 1-p donne la probabilité exacte qu'il ya une différence est la population. Même si, de nombreux chercheurs traitent 1-p comme cette probabilité de toute façon pour deux raisons. La première est que personne n'a mis au point une meilleure mesure à usage général. L'autre est que l'utilisation de ce calcul mène généralement une à une interprétation utile du nombre de signification statistique.

Articles Liés

Précédent ◈ Suivant