Comprendre Chi Square, Enquêtes pratiques

Ajout de toutes les différences, nous obtenons un total chi carré de 37,5, qui est encore une autre valeur intermédiaire dans ce calcul. Donc, à l'étape suivante.







De nombreuses statistiques reposent sur un concept appelé degrés de liberté. Les détails varient stat stat, mais il est basé sur le nombre de variables impliquées dans un calcul. Pour Chi Square, les degrés de liberté sont les suivants:

df = (# lignes - 1) * (colonnes # - 1)
= (2 - 1) * (2 - 1) = 1

Dans notre casting, nous avons maintenant:

  • Assortiment de valeurs observées et attendues
  • Total Chi carré = 37,5
  • Les degrés de liberté = 1

Nous avons deux autres joueurs, et ceux-ci sont la probabilité et la valeur critique.

Chaque fois que vous avez une statistique conçu pour « prédire » pour une population plus grande ou vous dire la validité ou la fiabilité d'une valeur, une partie du calcul est un niveau de confiance. Parfois, vous verrez cela indique que le niveau de risque tels que 5%, et à d'autres moments, on notera que le niveau de certitude, 95%. Pour Chi Square, les tables sont basées sur le niveau de risque, avec des seuils communs de 10%, 5%, 2,5%, 1% et 0,1%. a une valeur critique Chacun de ces niveaux de risque associé à:

Valeur critique
lorsque df = 1

Notre dernière étape pour calculer Chi Square est de comparer notre total aux valeurs critiques. Dans notre cas, 37,5> 10,83 ce qui signifie qu'il est encore plus de 99,9% significative. Si, au contraire, nous ne sommes arrivés avec un total de 4,5, qui est> 3,84 donc nous dirais que c'était 95% significative.

Calcul du chi carré dans la vie réelle

Si vous êtes chanceux, vous avez un logiciel d'enquête ou de statistiques qui prendra vos valeurs observées et crunch tout pour vous-même certains ne seront pas vous faire de spécifier une probabilité d'abord.

Bien que Microsoft Excel a une fonction TEST.KHIDEUX, il prend un peu de travail à la main. Vous devez générer manuellement toutes les valeurs attendues, et tout ce qu'il fait est de vous donner le total Chi place (notre 37.5). Pour obtenir la probabilité, vous devez le coupler avec la fonction LOI.KHIDEUX, donnant manuellement les degrés de liberté.







L'application Chi place aux enquêtes

Les types de questions:

Chi carré peut être utilisé avec une paire de questions discrètes de réponse unique. Ceci comprend:

  • Démographie
  • échelles Likert
  • Villes, noms de produits, noms d'instructeur, etc.
  • Dates une fois qu'ils ont été regroupés en périodes
  • Les chiffres une fois qu'ils ont été regroupés dans des plages

Les réponses ne doivent pas nécessairement être commandés, égale ou symétrique juste discret. Cela fait partie de ce qui fait Chi place une statistique très pratique pour les enquêtes.

Présenter l'information:

Alors que la statistique doit être calculée sur les comptes, ce n'est pas nécessairement la meilleure approche pour notre cerveau pour repérer les modèles. Par exemple, dans ce tableau, nous avons plus de trois fois le nombre de répondants de magasin comme en ligne:

Vous voulez garder les totaux de compte dans le rapport afin que les lecteurs connaissent les tailles relatives des groupes.

Cross-onglets peuvent également être bien adapté à des vues graphiques, y compris les graphiques à barres empilées, des graphiques à barres et ligne / graphiques profil.

cellules de faible numération:
Laissant tomber les options de réponse:

Dans notre exemple d'origine, notre échelle de la colonne aurait été « Oui / Incertain / Non. » Si la colonne a atteint 0 Incertain, nous devrions laisser tomber les valeurs attendues car il aurait tous été 0. Cela signifie que le calcul de la différence serait tenté de diviser par 0, ce qui est difficile.

lignes complètement vides ou des colonnes sont les seules réponses que vous devriez jamais déposer. Même s'il y avait seulement 1 réponse dans la colonne Incertain, vous devez inclure cette personne dans le tableau pour la statistique soit fiable. Cependant, nous pouvons, combiner avec Incertain Oui ou Non si nécessaire.

La combinaison de catégories:

Il est utilisé pour augmenter les nombre de cellules lorsque vous avez un trop grand nombre avec des réponses peu fréquentes, ou tout simplement de clarifier les relations pour votre analyse.

Avec une échelle ordonnée comme un 5 niveau Likert, cela pourrait prendre la forme de combiner les catégories supérieures et inférieures à un niveau 3 « D'accord / Ni / Pas d'accord » panne.

Avec des données non ordonnées telles que les noms de produits, vous pouvez combiner en catégories. Avec des noms de ville, vous pouvez regrouper les informations dans des régions géographiques ou classifications urbaines / rurales.

La question principale est de nous assurer que les catégories sont suffisamment liés que vous n'êtes pas masquer une relation. En cas de doute, d'abord exécuter le tableau croisé et Chi place sur une table élargie, puis commencer à combiner.

Questions laissées en blanc:

Et c'est la place Chi en quelques mots! (Ou aussi près que Nutshells statistiques déductives obtenir.)

Merci! Je vais l'ebook un de ces jours, mais le blog sera toujours le mieux pour des sujets spécialisés comme celui-ci. De plus, je préfère écrire un article que de payer pour la publicité ou assister à un déjeuner de réseautage ;-).

Merci! Vous avez besoin de revenir au clavier pour mes propres trucs d'abord :-)







Articles Liés