Jétudie les statistiques pour la science des données depuis quelques mois ..

1) Japprends cela, quand nous devons comparer plusieurs échantillons (> 2) puis un test T serait fastidieux et à la place, nous allons pour ANOVA et effectuer un «test F».

2) La compréhension ci-dessus crée une « exigence mutuellement exclusive entre le test F et le test T ».

3) Jai également appris que le test T (que ce soit: 1 sample / paired / 2 sample) teste essentiellement les différences de moyennes alors que le « test F » teste les différences de variances.

4) Maintenant, supposons que deux groupes déchantillons aient des moyennes presque égales mais des variances très différentes, alors , les deux tests donneraient des réponses différentes, non?

T test dirait « ils ne sont pas différents ». Mais « F test » dirait « ils sont différents ».

Ou même pour un cas inverse. (moyens extrêmement différents, mais à peu près les mêmes variances) ..

5) Donc, sur la base de quoi, (la moyenne? ou la variance?) nous allons enfin décider de leur vraie différence?

6) La question est donc: comment sont-ils liés? Si lobjectif initial était de découvrir que deux ou plusieurs échantillons sont différents ou non, alors comment «chercher des moyens» (cest-à-dire choisir le test T) pour un plus petit nombre de groupes déchantillons, devient «rechercher des variances» quand aucun des groupes déchantillons sont> 2? (Quand le fait est que la variance et la moyenne sont des caractéristiques fondamentalement indépendantes dun groupe déchantillons)

7) Ces deux mesures ne devraient-elles pas être vérifiées pour déterminer si vraiment les deux échantillons sont différents ou non?

(Jai mentionné les numéros de série des points que jai mentionnés. Veuillez indiquer si lun dentre eux est fondamentalement une mauvaise compréhension. Japprécierais que des réponses soient données pour chaque point)

Commentaires

  • Quentendez-vous exactement par  » comparaison déchantillons « ? Parlez-vous de comparer si la moyenne de la population quils viennent est la même / différente? Ou parlez-vous de vérifier si leur distribution est la même / différente?
  • Je ne suis pas sûr !! Parce que cest ce que je veux savoir.! Ne devrions-nous pas rechercher les deux pour décider  » que ces deux exemples de groupes sont différents ou non  » dans tous les aspects? Je nai trouvé aucun tutoriel mettant en évidence cette vue .. La plupart des tutoriels expliquent comme  » … pour comparer plus de deux groupes, optez pour le test F .. .. « . Cette fois, le point de vue passe de  » en regardant la moyenne  » en  » en regardant les variances !!  » .. Par conséquent, je ne suis pas clair à ce sujet!
  • En tant que nouvel étudiant en statistique, je ne sais pas à quoi faire attention! .. la plupart des tutoriels disent ..  » T test OU F test  » .. aucun des tutoriels na dit  » vérifie T ET F !! (mon avis: Ne devrait-on pas ‘ regarder sous les deux angles? (cest-à-dire les moyennes ainsi que les variances)?
  • Le lien ci-dessous y va en quelque sorte: Je lai déjà référé. Mais cela ne répond pas exactement à ma question): stats.stackexchange.com/questions/78150/…
  • Eh bien, faire un  » test  » cest trouver la réponse à une question. La première chose que vous devez savoir est quelle est la question réelle!

Réponse

Les termes t-test et F-Test sont ambigus, car tout test où la statistique de test a une distribution t (sous lhypothèse nulle) est appelé test t et tout test où la statistique de test a une distribution F est appelé test F. Il y en a plusieurs.

Ceci est pertinent pour votre question car il existe un test F qui compare les variances de deux échantillons, mais ce nest pas le F -test utilisé dans lanalyse ANOVA standard. En fait, le test F ANOVA compare la variabilité inter-groupe et intra-groupe, et la variabilité inter-groupe est en fait mesurée en mettant au carré et en additionnant les différences entre les moyennes de groupe, donc dans cette configuration, les tests t et F consistent à comparer groupe signifie. En fait, si vous navez que deux groupes / niveaux de facteur, la statistique du test F est le carré de la statistique du test t, et le test F équivaut au test t bilatéral. Pour plus de deux groupes, le problème avec les tests t est que le test t ne peut comparer que deux groupes à la fois, ce qui signifie que vous aurez besoin de plusieurs tests t pour comparer tous les groupes, impliquant des problèmes avec plusieurs tests (cest-à-dire si vous tester plusieurs hypothèses au niveau de 5%, la probabilité de trouver au moins une signification erronée en supposant que les hypothèses nulles sont toutes vraies peut être sensiblement supérieure à 5%).

De plus, vous avez raison de dire que lon peut être intéressé à explorer à la fois les différences entre les moyennes et les différences entre les variances, et les groupes avec la même moyenne peuvent encore avoir des variances différentes. Vous pouvez en effet les vérifier tous les deux, bien que cela implique encore une fois plusieurs tests; il ny a pas de déjeuner gratuit. Dans de nombreuses applications de lANOVA, il est soit assez raisonnable de supposer des variances égales, soit seules les différences moyennes sont dun intérêt substantiel (par exemple, se demander si un groupe obtient de «meilleurs» quun autre), donc des différences de variances ne font souvent pas lobjet dune enquête explicite (je mabstiendrai de dire si cela serait «bon» ou «correct»; ou plutôt ma réponse serait «cela dépend» …).

Commentaires

  • Merci pour lexplication

Réponse

Si vous comparent plus de deux groupes et sont intéressés à comparer leurs moyennes, alors il est habituel de faire une ANOVA comme vous dites, ce qui teste lhypothèse que toutes les moyennes des groupes sont égales. Faire plusieurs $ t $ -tests nest pas tout à fait équivalent car chaque test ne tets que si les moyennes de ces deux groupes sont égales. Votre point 1)

Lutilisation de $ F $ test à c La comparaison des variances est utilisée car ce que vous comparez dans lANOVA est la variance entre les moyennes des groupes et la variance au sein des groupes. (Votre point 3)

Il est difficile de répondre au reste de vos questions car, voir mes points ci-dessus, je pense que vous avez des idées fausses sur ce qui se passe.

Réponse

Considérez cette formule

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. du point de vue de la praticité cela pourrait être vrai.

2.Si vous avez un contrôle et un groupe traité de la même population, alors ils seront les mêmes. Mais disons que si vous avez des garçons contre des filles, emplacement1 contre emplacement2, ils pourraient être différents.

  1. Correct.
  2. Peut-être
  3. En fonction de votre objectif. Si vous voulez simplement savoir si le groupe a des caractéristiques différentes (comme la moyenne), faites un test t. Si vous voulez savoir si certains facteurs appliqués (comme les différents niveaux de nicotine de la cigarette) ont des effets significatifs, utilisez le test F.
  4. La formule est liée mais lapplication diffère en fonction de votre objectif .

  5. Non, car cela na aucun sens puisque les tests t et F ont un objectif ou un problème différent à résoudre.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *