Statistiques pour les Biologistes chi carré Test et son utilisation en biologie - Bitesize Bio

Statistiques est l'un des sujets les plus détestés par les biologistes du monde entier. Malgré sa dose quotidienne d'abus, la connaissance des statistiques peut être un épargnant de vie.







Chi carré de distribution et d'essai est l'un de la distribution de probabilité la plus importante et largement utilisé dans les statistiques déductives pour les étudiants en biologie et sciences de la vie. Elle est généralement basée sur des proportions variables présentes dans la condition expérimentale.

Le test du chi carré est populaire en raison de ses nombreux atouts, notamment:

  • Facile à calculer
  • Peut aussi être utilisé pour les données collectées à l'échelle nominale (catégorique)
  • Peut être utilisé pour étudier la différence entre les différentes variables en contrepartie
  • Ne fait pas d'hypothèses sur la distribution des données (par exemple la normalité)
  • Peut être utilisé pour les grands ensembles de données

En raison de sa popularité, je pensais le passer en revue pour vous ici.

Comment le test de chi carré utilisé?

Le test de chi carré peut être utilisé de deux façons:

1. Bonté de test Fit

Bonté de test d'ajustement est utilisé lorsque vous avez une théorie largement acceptée et que vous voulez vérifier si vos valeurs observées sont en phase avec la théorie ou non.

  • La bonté de test d'ajustement est normalement utilisé en génétique où les rapports génotypiques et phénotypiques ont déjà été établies pour un test donné et la population.
  • Vous pouvez également utiliser ce test dans le cas où le résultat attendu a déjà été mis en place. Par exemple: Vous voulez comprendre le résultat d'une expérience que vous définissez dans votre champ en fonction de la croix de test donné par Mendel. Vous observez que les résultats ne sont pas conformes à la théorie acceptée. Dans ce cas, vous pouvez vérifier la valeur p du test du chi carré pour bonté de test d'ajustement pour déterminer si les valeurs observées sont conformes à l'épreuve ou non [exemple similaire est expliqué plus tard]. Si la valeur de p <0.05, your experiment is a success. If not, better luck next time!
  • Dans les cas liés au principe de Hardy-Weinberg.

2. Test de l'indépendance des attributs

Indépendance des attributs, ou un test d'association des attributs de χ 2, est utilisé pour comprendre comment les deux attributs sont reliés les uns aux autres. Il est utilisé pour étudier si les proportions d'une variable sont différentes des valeurs des autres variables.

  • Comparaison des paramètres / attributs parmi les populations de contrôle et de test
  • Évaluation de la corrélation des symptômes de la maladie avec la maladie en cas de données cliniques

Étapes pour le calcul correct et la compréhension du test du chi carré

Les étapes suivantes sont des étapes générales qui pourraient être utilisées à la fois Qualité de l'ajustement de test, ainsi que pour le test d'indépendance des attributs.

Il y a 3 étapes simples pour chaque test du chi carré:

1. Développer vos hypothèses

Formuler l'hypothèse nulle

L'hypothèse nulle (H0), également connu sous l'hypothèse d'absence de différence, indique qu'il n'y a pas de différence dans les résultats avant ou après le test est effectué. Par exemple, disons que vous voulez comprendre l'effet de la lumière du soleil sur la croissance des plantes. Dans ce cas, votre hypothèse nulle indiquera que la lumière du soleil n'a pas d'effet sur la croissance des plantes.

Formulez l'hypothèse alternative

2. Faites vos calculs

Une fois que vous savez ce que vous testez, vous pouvez appliquer les calculs. Il existe de nombreux logiciels que vous pouvez utiliser, mais la formule pour le test est:

Déterminer le degré de liberté (df)

Remarque: Chaque calcul du chi carré peut être représenté comme matrice comme expliqué plus loin dans l'exemple 4.

Utiliser les tables chi carré (un exemple est joint à ce message) afin de déterminer la valeur de p. Vous ne devez vérifier la valeur de p correspondant au degré de liberté calculée à l'étape 3.

Maintenant, nous allons jeter un oeil à réaliser ces essais avec quelques exemples

Exemple de Test ajustement

Supposons que vous avez traversé des plantes pures de reproduction de génotype A / A, B / B, a / a, b / b et obtenu di-hybride A / a, B / b. Vous puis testez franchi à un / a, b / b. La matrice de génération F1 résultant de la progéniture était:







Statistiques pour les Biologistes chi carré Test et son utilisation en biologie - Bitesize Bio

Étape 1: Développer vos hypothèses

H0 = la génération F1 résultante est conforme à la théorie établie (1: 1: 1: 1).

H1 = la résultante de génération F1 est non conforme à la théorie établie.

Étape 2: Faites vos calculs

Statistiques pour les Biologistes chi carré Test et son utilisation en biologie - Bitesize Bio

df = 3 [. dans ce cas r = type de génotypes dans une étude à-dire A / B, A / B, A / B et A / B et c = No. des conditions dans lesquelles les génotypes sont en cours d'études (à savoir. Les valeurs observées et les valeurs attendues.)

Étape 3: Trouver p

Trouvez la valeur χ 2 de la table du chi carré à df = 3

Résultat. Vous pouvez accepter H0 parce que les résultats sont conformes à la théorie établie. χ 2 = 5,2 et se situe entre -7,81< 5.2 <+7.81 at α=0.05 ; α is called the confidence interval. An α = 0.05 is acceptable when the sample size is >30. Toutefois, si la taille des échantillons est <30, then 99% of curve is accepted at α=0.01.

Exemple pour l'indépendance des attributs

Supposons que dans un scénario que vous avez deux groupes de patients: l'un et l'autre malades non malades. 37/54 chanceux (ou plutôt malchanceux !!) malades et 13/66 personnes non malades ont été choisis pour l'administration de médicament 1.

Étape 1: Développer vos hypothèses

H0 = Drug 1 n'améliore pas la condition de la maladie

H1 = Drug 1 améliore l'état de la maladie

Étape 2: Faites vos calculs

Statistiques pour les Biologistes chi carré Test et son utilisation en biologie - Bitesize Bio

Statistiques pour les Biologistes chi carré Test et son utilisation en biologie - Bitesize Bio

Statistiques pour les Biologistes chi carré Test et son utilisation en biologie - Bitesize Bio

df = (r-1) x (c-1), dans ce cas r = 2 (nombre de conditions sous observation à-dire malade non malade) et c = 2 (pour les groupes traités et non traités)

Étape 3: Trouver p

Trouver χ 2 valeur de la table du chi carré à df = 1

Résultat. Vous pouvez accepter les Ho que les résultats sont conformes à la théorie établie. χ 2 = 2,89 et est compris entre -3,841< 2.89 <+3.841 at α=0.05

Quand pouvez-vous pas utiliser le test de chi carré?

Bien que chi carré est un test statistique puissant, il ne peut pas être utilisé dans toutes les situations. En particulier, il n'est pas valide:

Espérons que cela vous a aidé à comprendre ce qu'est un test de chi carré est quand et comment l'utiliser.

Statistiques pour les Biologistes chi carré Test et son utilisation en biologie - Bitesize Bio

Je fis la grimace de douleur et arrêté de lire plus loin après avoir vu, « Si la valeur de p <0.05, your experiment is a success. If not, better luck next time!" Oh, my goodness - no, no, no. 🙂 The magnitude of the p-value has NOTHING to do with the "success" of an experiment. If the experiment is properly designed and properly carried out (i.e. no experimental error and no measurement error), then the experiment is a success, regardless of the result. A p-value is useful only for making an *inference* about the statistical *population* represented by the *observed sample*. If "sum[(observed — expected)^2/expected]" is bigger than zero, then the *observed* frequencies are different from the expected frequencies. A p-value isn&#'t needed for the investigator to see if chi-square (which is a difference) is bigger than zero for her sample. What is the probability of detecting a difference as big or bigger than the one observed *if* the difference doesn&#'t exist in the population from which the samples were taken? Ah, that&#'s the question answered by the p-value.

Article de Nice, bien que je ne dois sonner et fixer une réclamation. « Ne fait pas d'hypothèses sur la distribution des données (par exemple la normalité) ». C'est faux. D'où les valeurs p proviennent? Fondamentalement, ce que vous faites à partir d'un point de vue mathématique que vous utilisez les valeurs mises en commun comme le « vrai » modèle (ie hypothèse nulle) qu'il n'y a pas d'effet, et vous calculer l'erreur quadratique moyenne (variance) pour les valeurs trouvées pour tous les effets. Ensuite, vous posez la question, ces écarts ne sens? Si elle était complètement déterministe et votre (null) hypothèse était correcte, les valeurs des données mises en commun correspondent aux facteurs seraient dans la partie correcte et tout serait dandy et la statistique de test liraient zéro.

Cependant, ce que vous est au contraire que les choses que vous ajouté tous sont des carrés de quelque chose avec moyenne nulle variance 1 (puisque vous soustrait la moyenne et diviser l'écart le terme de variance, c'est la raison pour laquelle la soustraction et la division sont dans l'équation), et vous devez demander comment est probablement cela? Eh bien, ce n'est pas assez d'information sans connaître la distribution (la moyenne et la variance ne détermine pas la distribution de toutes les distributions de probabilité, seulement très simples comme Poisson et distributions normales). Cependant, vous faites l'hypothèse que chacun d'entre eux sont la variance moyenne zéro 1 (standard) normalement distribué des variables aléatoires (si vous avez des données infinies, cette hypothèse est toujours correcte). Ainsi, vous définissez mathématiquement la distribution du chi carré de degré k à la somme des variables aléatoires k normale standard. De là, un peu de mathématiques permet de savoir ce que la distribution est (la meilleure façon d'être grâce à des fonctions caractéristiques) et donc vous trouver la probabilité d'avoir cette somme des carrés supérieure ou égale à une valeur donnée.

Mais remarquez ce que vous aviez à faire: il fallait faire l'hypothèse de normalité sur chaque terme de la somme afin de lier la statistique de test à l'objet très mathématique (la distribution du chi carré) afin de l'utiliser pour calculer une probabilité de voir une valeur ce grand ou plus.

Cependant, il existe un moyen de calculer (en quelque sorte) une probabilité « exacte » pour ce genre de problèmes, et ce serait le test exact de Fisher. Une recherche rapide sur Google évoquera le test et la façon de le faire. Cependant, dans la pratique, il est pas vraiment différent d'un test du chi carré, les différences ne viennent vraiment quand vous avez des questions standard qui affligent les tests qui reposent sur la normalité (à savoir ont une grande valeur aberrante).







Articles Liés