Jeg studerer statistik for datalogi siden få måneder ..

1) Jeg lærer det, når vi skal sammenligne flere prøver (> 2), så ville en T-test være kedelig, og i stedet går vi til ANOVA og udfører en “F-test”.

2) Ovenstående forståelse skaber et “gensidigt eksklusivt krav mellem F-test og T-test.”

3) Jeg har også lært, at T-testen (det være sig: 1 prøve / parret / 2 prøve) testes grundlæggende for forskelle i midler, mens “F-test” -test for forskelle i variationer.

4) Antag nu, at to prøvegrupper har næsten lige gennemsnit, men meget forskellige afvigelser, så , ville begge tests give forskellige svar, ikke?

T-test ville sige “de er ikke forskellige”. Men “F-test” vil sige “de er forskellige”.

Eller endda for en omvendt sag. (meget forskellige midler, men næsten samme afvigelser) ..

5) Så baseret på hvad (middelværdien? eller variansen?) vil vi endelig bestemme deres sande forskel?

6) Så spørgsmålet er: Hvordan er de beslægtede? Hvis det oprindelige mål var at finde ud af, at to eller flere prøver er forskellige eller nej, så hvordan “at lede efter midler” (dvs. vælge T-test) for mindre antal af prøvegrupper, ændres til “på udkig efter afvigelser” når ingen af prøvegrupper er> 2? (Når faktum er: varians og gennemsnit er grundlæggende uafhængige karakteristika for en prøvegruppe)

7) Bør ikke disse begge målinger kontrolleres for at finde ud af, om de to prøver virkelig er forskellige eller ikke?

(Jeg har nævnt serienumre til punkter, som jeg har angivet. Vær opmærksom på, om nogen af dem er en grundlæggende forkert forståelse. Vil sætte pris på, hvis der gives svar for hvert punkt)

Kommentarer

  • Hvad mener du nøjagtigt med ” sammenligning af prøver “? Taler du om at sammenligne, om gennemsnittet af den befolkning, de kommer, er det samme / anderledes? Eller taler du om at kontrollere, om deres distribution er den samme / forskellig?
  • Jeg er ikke sikker !! Fordi det er hvad jeg vil vide.! Bør vi ikke kigge efter begge til at beslutte ” disse to prøvegrupper er forskellige eller ikke ” i alle henseender? Jeg kunne ikke finde nogen tutorial, der fremhævede denne opfattelse .. De fleste tutorials forklarer som ” … for at sammenligne mere end to grupper, gå til F test .. .. “. Denne gang skifter synspunktet fra ” ser på gennemsnit ” til ” ser på varianter !! ” .. Derfor er jeg ikke klar over dette!
  • Som ny studerende på stat ved jeg ikke, hvad jeg skal passe på! .. de fleste af selvstudier siger .. ” T-test ELLER F-test ” .. ingen af tutorialen sagde ” tjek for både T OG F !! (min mening: Skal vi ‘ t se fra begge vinkler? (dvs. middel såvel som afvigelser)?
  • Nedenstående link går derhen: Jeg har allerede henvist det. Men ikke ligefrem svarer det på mit spørgsmål): stats.stackexchange.com/questions/78150/…
  • Nå, at lave en ” test ” er at finde svaret på et spørgsmål. Det første du skal vide er, hvad det egentlige spørgsmål er!

Svar

Termerne t-test og F-Test er tvetydige, fordi enhver test, hvor teststatistikken har en t-fordeling (under nulhypotesen) kaldes t-test, og enhver test, hvor teststatistikken har en F-fordeling, kaldes F-test. Der er mere end en forekomst af disse.

Dette er relevant for dit spørgsmål, fordi der er en F-test, der sammenligner variationerne i to prøver, men dette er ikke F -test anvendt i standard ANOVA-analyse. Faktisk sammenligner ANOVA F-testen mellem variationer i gruppe og inden for gruppe, og variabilitet mellem grupper måles faktisk ved at kvadrere og opsummere forskelle mellem gruppemedier, så i denne opsætning handler både t- og F-test om at sammenligne gruppe betyder. Faktisk, hvis du kun har to grupper / faktorniveauer, er F-teststatistikken kvadratet af t-teststatistikken, og F-testen svarer til den tosidede t-test. I mere end to grupper er problemet med t-tests, at t-testen kun kan sammenligne to grupper ad gangen, hvilket betyder, at du har brug for flere t-tests for at sammenligne alle grupper, der involverer problemer med flere tests (dvs. hvis du test flere hypoteser på 5% niveau, sandsynligheden for at finde mindst en forkert betydning forudsat at nulhypoteserne alle er sande kan være væsentligt højere end 5%).

Derudover har du ret i, at man kan være interesseret i at udforske både forskelle mellem midler og forskelle mellem afvigelser, og grupper med samme gennemsnit kan stadig have forskellige afvigelser. Du kan faktisk kontrollere dem begge, selvom dette igen involverer flere tests; der er ingen gratis frokost. I mange applikationer af ANOVA er det enten ret rimeligt at antage lige afvigelser eller kun betyde, at forskelle er af væsentlig interesse (f.eks. kun spekulerer på, om en gruppe klarer sig “bedre” end en anden), derfor forskelle i variation bliver ofte ikke eksplicit undersøgt (jeg undlader at udsætte mig for en erklæring om, hvorvidt dette ville være “godt” eller “korrekt”; eller rettere ville mit svar være “det afhænger” …).

Kommentarer

  • Tak for forklaringen

Svar

Hvis du sammenligner mere end to grupper og er interesseret i at sammenligne deres middel, så er det almindeligt at lave ANOVA, som du siger, som tester hypotesen om, at alle gruppemedier er ens. Gør flere $ t $ -tests er ikke helt ækvivalente, fordi hver test kun tester, hvis middelværdien i de to grupper er ens. Dit punkt 1)

Brug af $ F $ test til c ompare-afvigelser bruges, fordi det, du sammenligner i ANOVA, er variansen mellem gruppens middel kontra variansen inden for grupper. (Dit punkt 3)

Resten af dine spørgsmål er svære at besvare, for se mine punkter ovenfor, jeg tror, du har nogle misforståelser om, hvad der sker.

Svar

Overvej denne formel

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. fra praktisk synspunkt dette kan være rigtigt korrekt.

2.Hvis du har en kontrol og behandlet gruppe udgør den samme population, så vil de være de samme. Men sig, hvis du har drenge vs piger, placering1 vs placering2, kan de være forskellige.

  1. Korrekt.
  2. Muligvis
  3. Afhængigt af dit mål. Hvis du bare vil vide, om gruppen har forskellige egenskaber (som gennemsnit), så t-test. Hvis du vil vide, om visse anvendte faktorer (som forskellige niveauer af cigaretnikotin) har signifikante virkninger, skal du bruge F-test.
  4. Formlen er relateret, men applikationen varierer afhængigt af dit mål .

  5. Nej, da det ikke giver nogen mening, da t- og F-testen har forskellige mål eller problemer, de løser.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *