Supposons que nous puissions choisir parmi deux catalyseurs différents. 10 observations sont tirées du premier et 12 de lautre. Si $ s_1 = 14 $ et $ s_2 = 28 $, pouvons-nous rejeter à $ \ alpha = 5 \% $ lhypothèse que les variances sont égales?

Voici ce que lenseignant a fait:

Le rapport est: $ s_1 / s_2 = 0,5. $

Alors

$$ P (F_ {n = 9, m = 11} \ le 0,5) = 0.1538 $$

Puis il dit: la p-value est $ 2 \ times \ min (0.1539; 0.8461) = 0.3074 $ et il rejette $ H_0 $.

Comment obtenir le 0.1538?

Je pense que je peux vérifier une F-table pour n = 9, m = 11, mais que dois-je faire alors pour avoir la probabilité que cette valeur soit $ \ le 0.5 $?

Commentaires

  • Jai corrigé un tout derreurs typographiques apparentes. Veuillez vérifier la question et corriger tout malentendu que jai pu introduire. Avec les statistiques que vous donnez, $ H_0 $ ne devrait pas être rejeté.
  • Cela dépend de létendue de vos tables F et de leur ' réorganisé. Vous pouvez également utiliser un programme intégrant le cdf pour la distribution F. Par exemple, dans R: pf(.5,9,11) donne la réponse [1] 0.1537596
  • @Glen_b, laissez ' dire que nous avons F (.5,9,11). Ce que vous dites, cest que dans une table comme celle-ci socr.ucla.edu/applets.dir/f_table.html , je suis supposé trouver la sous-table appropriée , puis regardez n = 9 et m = 11 et obtenez la probabilité à partir de là. Non?
  • Ce que vous avez, cest un tableau des valeurs critiques. Il ne donne que des zones de queue jusquà 10%; vous pouvez utiliser les propriétés du F pour trouver des valeurs de queue inférieures, mais la plus grande valeur p unilatérale que vous pouvez obtenir à partir de cet ensemble de tables sera de 10%. Tout ce que vous ' pouvoir dire est " > 0,1 " plutôt que " = 0.1538 "
  • Ok. Laissons ' faire comme si je fais un examen là-dessus demain. Comment vais-je obtenir ma valeur P dans une question de test F, sans ordinateur?

Réponse

La première chose à noter est que puisquil sagit dun test de variance, vous pouvez avoir des F « grands ou petits significatifs, alors que souvent les tables F supposent que vous faites des calculs de type ANOVA (où seules les grandes valeurs de F peuvent provoquer le rejet).

Vous devez donc utiliser le fait que la queue inférieure de $ F (\ nu_1, \ nu_2) $ est la même que linverse de la queue supérieure de $ F (\ nu_2, \ nu_1 ) $.

Il ya « un peu plus de discussion à ce sujet ici

Comment puis-je savoir dans quelle queue je me trouve? – La médiane dune distribution F dans les cas dont vous aurez besoin pour un test de variance être proche de 1. Donc, si la statistique F est inférieure à 1, supposons que vous ayez besoin de la queue inférieure. Sil est plus grand que 1, supposons que vous ayez besoin de la queue supérieure.

Dans lexemple numérique de votre question, F = 0,5 – vous voulez une queue inférieure pour F.

Donc, pour trouver cela, vous devez permuter les degrés de liberté, et les valeurs F seront toutes les inverses de celles dont vous avez besoin. Puisque vous avez besoin de la zone inférieure à 0,5, cest la même chose que de trouver la zone ci-dessus 1 / 0.5 = 2 sur un $ F_ {11,9} $.

Vous devez donc dabord vous soucier du $ \ alpha $ le plus élevé que vous puissiez trouver (0,1 dans les tableaux indiqués ).

Puisque les tables que vous avez liées ont df1 sur les colonnes, vous devez trouver la colonne 11 et la ligne 9 dans ce cas.

Vous n’avez pas de 11, alors regardons 10 et 12:

 ... 10 12 ⁞ 9 2.41632 2.37888 

Alors, comment gérez-vous le fait quil ny ait pas de 11?

Eh bien, tout dabord, notez que tant que df2 est au moins 3 (et ce sera pour un test de variance dans un examen), le tableau des valeurs critiques diminue à mesure que df augmente

Donc, si vous obtenez simplement une borne inférieure de la valeur p, regardez le df inférieur suivant (cest-à-dire comparez avec df1 = 10 dans ce cas).

[Pour plus de précision, consultez cet article sur linterpolation, qui traite de linterpolation en degrés de liberté pour le F vers la fin. Si votre test se profile, je doute que vous ayez le temps pour apprendre autre chose que linterpolation linéaire. Cela suggère une interpolation linéaire dans la réciproque des degrés de liberté.]

La valeur à df1 10, df2 = 9 est 2,41632, ce qui est plus grand que votre 2. Donc vous « est plus proche de 1 que la valeur 0,1.

Ce qui signifie que votre valeur p inférieure à la queue est> 0,1


Et si le problème était similaire à celui de la question mais que le F était de 0,4 $ au lieu de 0,5 $?

1 / 0,4 = 2,5 ce qui signifie quil est plus loin dans la queue que les deux valeurs de 0,10 ci-dessus (2,41632, 2,37888). Donc, la queue inférieure p < 0,10.

Maintenant, comparez avec les valeurs de 5%. Nous voyons que cest moins que les valeurs 12,9 et 10,9 (qui sont toutes deux juste au-dessus de 3). Donc, la queue inférieure p> 0,05. Donc 0,05 $ < p < 0.10 $.

Et si le problème était similaire à celui de la question mais que le F était entre les valeurs pour 10 et 12?

Disons maintenant que le rapport F était de 0,323.

Cest entre la valeur de 0,05 pour 10,9 et 12,9 df – p < 0,05 ou> 0,05?

Possibilité 1: dites que cest environ 0,05.

Possibilité 2: est de dire quil faut au moins le prochain plus petit (p> 0,025)

Possibilité 3: utiliser linterpolation (mais cette fois dans le niveau de signification, pas le df), comme décrit au lien dinterpolation que jai donné précédemment. Cela suggère une interpolation linéaire dans $ \ log \ alpha $.

Personnellement, si jamais jétais possédé pour faire un F-test des variances en pratique *, mais en quelque sorte incapable daccéder même à une calculatrice (avec laquelle faire une intégration numérique rapide), je choisirais loption 3. Si je ne pouvais pas le faire pour une raison quelconque, je choisirais loption 1. Cependant, les attentes de la personne qui la marque pourraient bien être loption 2.

* si je prenais des hallucinogènes puissants, ou si javais subi un grave traumatisme crânien, ou un autre incident me rendant dune manière ou dune autre incapable dapprécier à quel point ce serait une très mauvaise idée.


Valeurs p à deux queues

Il semble que vous ayez lintention de simplement doubler les valeurs p unilatérales pour obtenir des valeurs bilatérales.

Cest très bien dans la mesure où cela disparaît, alors tenez-vous-en à cela, mais pour une discussion de certains des problèmes plus en détail, consultez la discussion dans lexemple à la fin de la réponse ici

[Peut ajouter des détails plus tard]

Réponse

Dabord, le F la statistique nest pas le rapport des écarts std. Cest le rapport des variances. Donc, F est 196/784 = 0,25. La valeur p serait alors 0,047.

Réponse

Si vous avez besoin dune valeur p à deux queues, vous pouvez utiliser:

$$ P- valeur = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$

où:

$ F_0 = {S_1 ^ 2 \ over S_2 ^ 2} $

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *