Jeg studerer statistikk for datavitenskap siden noen måneder ..

1) Jeg lærer det når vi må sammenligne flere prøver (> 2), så ville en T-test være kjedelig, og i stedet går vi for ANOVA og gjennomfører en «F-test».

2) Over forståelse skaper et «gjensidig utelukkende krav mellom F-test og T-test.»

3) Jeg har også lært at, T-testen (det være seg: 1 sample / paired / 2 sample) i utgangspunktet tester for forskjeller i midler mens «F test» tester for forskjeller i avvik.

4) Anta at to prøvegrupper har nesten like midler, men svært forskjellige avvik, , begge testene vil gi forskjellige svar, ikke sant?

T-testen vil si «de er ikke forskjellige». Men «F-test» vil si «de er forskjellige».

Eller til og med for en omvendt sak. (veldig forskjellige midler, men nesten samme avvik) ..

5) Så basert på hva, (gjennomsnittet? eller avviket?) skal vi endelig bestemme deres virkelige forskjell?

6) Så spørsmålet er: Hvordan er de i slekt? Hvis det opprinnelige målet var å finne ut at to eller flere prøver er forskjellige eller ingen, blir hvordan «å lete etter midler» (dvs. velge T-test) for mindre antall prøvegrupper, endret til «å se etter avvik» når ingen av prøvegruppene er> 2? (Når faktum er: variansen og gjennomsnittet er i utgangspunktet uavhengige karakteristikker for en prøvegruppe)

7) Bør ikke disse begge beregningene kontrolleres for å finne ut om de to prøvene er forskjellige eller ikke?

(Jeg har nevnt serienumre til punkter som jeg har oppgitt. Vennligst påpek om noen av dem er i utgangspunktet feil forståelse. Ville sette pris på om det gis svar for hvert punkt)

Kommentarer

  • Hva mener du nøyaktig med at » sammenligner eksempler «? Snakker du om å sammenligne om gjennomsnittet av befolkningen de kommer er det samme / forskjellig? Eller snakker du om å sjekke om distribusjonen deres er den samme / forskjellig?
  • Jeg er ikke sikker !! For det er det jeg vil vite.! Bør vi ikke se etter begge deler for å bestemme » disse to utvalgsgruppene er forskjellige eller ikke » i alle aspekter? Jeg fant ingen opplæring som fremhevet denne visningen .. De fleste opplæringene forklarer » … for å sammenligne mer enn to grupper, gå til F-test .. .. «. Den gangen endres utsiktspunktet fra » ser på gjennomsnittet » til » ser på avvik !! » .. Derfor er jeg ikke klar over dette!
  • Som ny student i stat, vet jeg ikke hva jeg skal se etter! .. de fleste av opplæringen sier .. » T test ELLER F test » .. ingen av opplæringen sa » sjekk for både T OG F !! (min mening: Skal vi ikke ‘ t se fra begge vinkler? (dvs. middel samt avvik)?
  • Koblingen nedenfor går der: Jeg har henvist det allerede. Men ikke akkurat det svarer på spørsmålet mitt): stats.stackexchange.com/questions/78150/…
  • Vel, å lage en » test » er å finne svaret på et spørsmål. Det første du trenger å vite er hva det faktiske spørsmålet er!

Svar

Begrepene t-test og F-Test er tvetydige, fordi enhver test der teststatistikken har en t-fordeling (under nullhypotesen) kalles t-test, og enhver test der teststatistikken har en F-fordeling kalles F-test. Det er mer enn ett tilfelle av disse.

Dette er relevant for spørsmålet ditt fordi det er en F-test som sammenligner avvikene til to prøver, men dette er ikke F -test brukt i standard ANOVA-analyse. ANOVA F-testen sammenligner faktisk variasjon mellom gruppe og gruppe, og variasjon mellom gruppe blir faktisk målt ved å kvadre og oppsummere forskjeller mellom gruppemiddel, så i dette oppsettet handler både t- og F-test om å sammenligne gruppe betyr. Faktisk, hvis du bare har to grupper / faktornivåer, er F-teststatistikken kvadratet til t-teststatistikken, og F-testen tilsvarer den tosidige t-testen. For mer enn to grupper er problemet med t-tester at t-testen bare kan sammenligne to grupper på en gang, noe som betyr at du trenger flere t-tester for å sammenligne alle grupper, og involverer problemer med flere tester (dvs. hvis du test flere hypoteser på 5% nivå, sannsynligheten for å finne minst en feil betydning forutsatt at nullhypotesene alle er sanne kan være vesentlig høyere enn 5%).

I tillegg har du rett i at man kan være interessert i å utforske både forskjeller mellom middel og forskjeller mellom avvik, og grupper med samme gjennomsnitt kan fortsatt ha forskjellige avvik. Du kan faktisk sjekke dem begge, selv om dette igjen innebærer flere tester; det er ingen gratis lunsj. I mange applikasjoner av ANOVA er det enten ganske rimelig å anta like avvik, eller bare mener forskjeller er av betydelig interesse (f.eks. bare lurer på om en gruppe presterer «bedre» enn en annen), derfor er forskjeller i blir ofte ikke eksplisitt undersøkt (jeg vil avstå fra en uttalelse om dette ville være «bra» eller «riktig»; eller rettere svaret mitt ville være «det kommer an på …».

Kommentarer

  • Takk for forklaringen

Svar

Hvis du sammenligner mer enn to grupper og er interessert i å sammenligne deres middel, så er det vanlig å gjøre ANOVA som du sier som tester hypotesen om at alle gruppemedier er like. Å gjøre flere $ t $ -tests er ikke helt ekvivalent fordi hver test bare tester hvis middelene i de to gruppene er like. Ditt poeng 1)

Bruken av $ F $ test til c ompare avvik brukes fordi det du sammenligner i ANOVA er avviket mellom gruppen betyr versus avviket i gruppene. (Ditt poeng 3)

Det er vanskelig å svare på resten av spørsmålene dine, for jeg ser at du har noen misforståelser om hva som skjer. Se punktene mine ovenfor.

Svar

Vurder denne formelen

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. fra praktisk synspunkt dette kan være riktig.

2.Hvis du har en kontroll og behandlet gruppe danner samme populasjon, vil de være den samme. Men si at hvis du har gutter mot jenter, location1 vs location2, kan de være forskjellige.

  1. Riktig.
  2. Muligens
  3. Avhengig av målet ditt. Hvis du bare vil vite om gruppen har forskjellige egenskaper (som gjennomsnitt), så t-test. Hvis du vil vite om visse anvendte faktorer (som forskjellige nivåer av sigarettnikotin) har betydelige effekter, så bruk F-test.
  4. Formelen er relatert, men applikasjonen er forskjellig avhengig av målet ditt .

  5. Nei. siden det ikke gir mening siden t- og F-testen har forskjellige mål eller problemer de løser.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *