Ich studiere seit einigen Monaten Statistik für Datenwissenschaft.

1) Das lerne ich, wenn wir mehrere vergleichen müssen Proben (> 2) dann wäre ein T-Test mühsam und stattdessen gehen wir zur ANOVA und führen einen „F-Test“ durch.

2) Über das Verständnis hinaus entsteht eine „sich gegenseitig ausschließende Anforderung zwischen F-Test und T-Test“.

3) Ich habe auch gelernt, dass der T-Test (sei es: 1 Stichprobe / gepaart / 2 Stichprobe) testet grundsätzlich auf Mittelwertunterschiede, während „F-Test“ auf Varianzunterschiede prüft.

4) Nehmen wir nun an, zwei Stichprobengruppen haben nahezu gleiche Mittelwerte, aber stark unterschiedliche Varianzen würden beide Tests unterschiedliche Antworten geben, oder?

Der Test würde sagen „sie sind nicht unterschiedlich“. Aber „F-Test“ würde sagen „sie sind unterschiedlich“.

Oder sogar für einen umgekehrten Fall. (sehr unterschiedliche Mittel, aber fast gleiche Abweichungen) ..

5) Auf der Grundlage dessen, was (der Mittelwert? oder die Abweichung?), werden wir endlich über ihren wahren Unterschied entscheiden?

6) Die Frage ist also: Wie hängen sie zusammen? Wenn das ursprüngliche Ziel darin bestand, herauszufinden, ob zwei oder mehr Proben unterschiedlich sind oder nicht, wird das „Suchen nach Mitteln“ (dh die Auswahl des T-Tests) für eine kleinere Anzahl von Probengruppen in „Suchen nach Varianzen“ geändert, wenn keine Probengruppen vorhanden sind sind> 2? (Wenn die Tatsache ist: Varianz und Mittelwert sind grundsätzlich unabhängige Merkmale einer Stichprobengruppe.)

7) Sollten diese beiden Metriken nicht überprüft werden, um festzustellen, ob die beiden Stichproben wirklich unterschiedlich sind oder nicht? P. >

(Ich habe Seriennummern zu Punkten angegeben, die ich angegeben habe. Bitte weisen Sie darauf hin, wenn einer von ihnen ein grundsätzlich falsches Verständnis darstellt. Ich würde mich freuen, wenn für jeden Punkt Antworten gegeben werden.)

Kommentare

  • Was genau meinen Sie mit “ Vergleichen von Beispielen „? Sprechen Sie über den Vergleich, ob der Mittelwert der Bevölkerung gleich / unterschiedlich ist? Oder redest du darüber, ob ihre Verteilung gleich / verschieden ist?
  • Ich bin mir nicht sicher !! Weil ich das wissen will! Sollten wir nicht nach beiden suchen, um “ zu entscheiden, dass diese beiden Stichprobengruppen unterschiedlich sind oder nicht “ in allen Aspekten? Ich konnte kein Tutorial finden, das diese Ansicht hervorhob. Die meisten Tutorials erklären wie “ … um mehr als zwei Gruppen zu vergleichen, gehen Sie zum F-Test .. .. „. Dieses Mal ändert sich der Blickwinkel von “ mit Blick auf den Mittelwert “ zu “ mit Blick auf Abweichungen !! “ .. Daher ist mir dies nicht klar!
  • Als neuer Student der Statistik weiß ich nicht, worauf ich achten soll! .. am meisten In den Tutorials heißt es .. “ T-Test ODER F-Test “ .. Keines der Tutorials sagte “ auf T UND F prüfen !! (Meine Meinung: Sollten wir nicht ‚ aus beiden Blickwinkeln schauen? (dh sowohl die Mittelwerte als auch die Abweichungen)?
  • Der folgende Link führt dorthin: Ich habe es bereits verwiesen. Aber nicht genau beantwortet es meine Frage): stats.stackexchange.com/questions/78150/…
  • Wenn Sie einen “ -Test “ durchführen, finden Sie die Antwort auf eine Frage. Das erste, was Sie wissen müssen, ist, was die eigentliche Frage ist!

Antwort

Die Begriffe t-Test und F-Test sind nicht eindeutig, da jeder Test, bei dem die Teststatistik eine t-Verteilung aufweist (unter der Nullhypothese), als t-Test bezeichnet wird und jeder Test, bei dem die Teststatistik eine F-Verteilung aufweist, als F-Test bezeichnet wird. Es gibt mehr als eine Instanz davon.

Dies ist für Ihre Frage relevant, da es einen F-Test gibt, der die Varianzen von zwei Stichproben vergleicht, aber dies ist nicht das F. -Test in der Standard-ANOVA-Analyse verwendet. Tatsächlich vergleicht der ANOVA-F-Test die Variabilität zwischen Gruppen und innerhalb der Gruppe, und die Variabilität zwischen Gruppen wird tatsächlich durch Quadrieren und Summieren der Unterschiede zwischen den Gruppenmitteln gemessen. In diesem Aufbau geht es also sowohl beim t- als auch beim F-Test um den Vergleich Gruppe bedeutet. Wenn Sie nur zwei Gruppen / Faktorstufen haben, ist die F-Test-Statistik das Quadrat der T-Test-Statistik, und der F-Test entspricht dem zweiseitigen T-Test. Bei mehr als zwei Gruppen besteht das Problem bei T-Tests darin, dass der T-Test nur zwei Gruppen gleichzeitig vergleichen kann. Dies bedeutet, dass Sie mehrere T-Tests benötigen, um alle Gruppen zu vergleichen, was Probleme mit mehreren Tests beinhaltet (dh wenn Sie dies tun) Testen Sie mehrere Hypothesen auf 5% -Niveau. Die Wahrscheinlichkeit, mindestens eine falsche Signifikanz zu finden, unter der Annahme, dass alle Nullhypothesen wahr sind, kann wesentlich höher als 5% sein.

Außerdem haben Sie Recht, dass Sie möglicherweise daran interessiert sind, sowohl Unterschiede zwischen Mittelwerten als auch Unterschiede zwischen Varianzen zu untersuchen, und Gruppen mit demselben Mittelwert können immer noch unterschiedliche Varianzen aufweisen. Sie können in der Tat beide überprüfen, obwohl dies wiederum mehrere Tests umfasst; Es gibt kein kostenloses Mittagessen. In vielen ANOVA-Anwendungen ist es entweder ziemlich vernünftig, gleiche Abweichungen anzunehmen, oder es sind nur mittlere Unterschiede von erheblichem Interesse (z. B. nur die Frage, ob eine Gruppe „besser“ als eine andere abschneidet), daher Unterschiede in den Abweichungen werden oft nicht explizit untersucht (ich werde mich einer Aussage enthalten, ob dies „gut“ oder „richtig“ wäre; oder vielmehr wäre meine Antwort „es kommt darauf an …“).

Kommentare

  • Danke für die Erklärung

Antwort

Wenn Sie Wenn Sie mehr als zwei Gruppen vergleichen und daran interessiert sind, ihre Mittelwerte zu vergleichen, ist es üblich, eine ANOVA durchzuführen, während Sie sagen, dass die Hypothese getestet wird, dass alle Gruppenmittelwerte gleich sind. Mehrere $ t $ -Tests ist nicht ganz gleichwertig, da jeder Test nur dann überprüft wird, wenn die Mittelwerte in diesen beiden Gruppen gleich sind. Ihr Punkt 1)

Die Verwendung des $ F $ Test bis c ompare Varianzen wird verwendet, da Sie in ANOVA die Varianz zwischen den Gruppenmitteln und der Varianz innerhalb der Gruppen vergleichen. (Ihr Punkt 3)

Der Rest Ihrer Fragen ist schwer zu beantworten, da Sie, siehe meine obigen Punkte, einige falsche Vorstellungen darüber haben, was gerade vor sich geht.

Antwort

Betrachten Sie diese Formel

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. aus praktischer Sicht Dies könnte richtig sein.

2.Wenn Sie eine Kontrollgruppe und eine behandelte Gruppe aus derselben Population haben, sind sie gleich. Aber sagen Sie, wenn Sie Jungen gegen Mädchen haben, Ort1 gegen Ort2, könnten sie unterschiedlich sein.

  1. Richtig.
  2. Möglicherweise
  3. Abhängig von Ihrem Ziel. Wenn Sie einfach wissen möchten, ob die Gruppe unterschiedliche Merkmale aufweist (wie der Durchschnitt), dann t-Test. Wenn Sie wissen möchten, ob bestimmte angewendete Faktoren (wie z. B. unterschiedliche Nikotinwerte der Zigarette) signifikante Auswirkungen haben, verwenden Sie den F-Test.
  4. Die Formel ist verwandt, die Anwendung hängt jedoch von Ihrem Ziel ab .

  5. Nein, da dies keinen Sinn ergibt, da t- und F-Test unterschiedliche Ziele oder Probleme haben, die sie lösen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.