Jag studerar statistik för datavetenskap sedan några månader ..

1) Jag lär mig att när vi måste jämföra flera prover (> 2) då skulle ett T-test vara tråkigt och istället går vi för ANOVA och genomför ett ”F-test”.

2) Ovanför förståelsen skapar ett ”ömsesidigt exklusivt krav mellan F-test och T-test.”

3) Jag har också lärt mig att T-testet (vare sig det är: 1 prov / parat / 2 prov) testar i princip för skillnader i medel medan ”F-test” testar för skillnader i avvikelser.

4) Antag nu att två provgrupper har nästan lika medel men mycket olika avvikelser, då , skulle båda testerna ge olika svar, eller hur?

T-test skulle säga ”de är inte olika”. Men ”F-test” skulle säga ”de är olika”.

Eller till och med för ett omvänt fall. (enormt olika medel, men nästan samma varians) ..

5) Så baserat på vad, (medelvärdet? eller variansen?) kommer vi äntligen att bestämma deras verkliga skillnad?

6) Så frågan är: Hur är de relaterade? Om det ursprungliga målet var att ta reda på att två eller flera prover är olika eller inga, ändras då ”letar efter medel” (dvs att välja T-test) för mindre antal provgrupper till ”letar efter avvikelser” när ingen av provgrupperna är> 2? (När faktum är: variansen och medelvärdet är i grunden oberoende egenskaper hos en provgrupp)

7) Borde inte dessa båda mätvärden kontrolleras för att hitta om de två proverna verkligen är olika eller inte?

(Jag har nämnt serienummer till punkter som jag har angett. Vänligen påpeka om någon av dem är i princip felaktig förståelse. Skulle uppskatta om svar ges för varje punkt)

Kommentarer

  • Vad menar du exakt med att ” jämför prov ”? Pratar du om att jämföra om medelvärdet av befolkningen de kommer är detsamma / annorlunda? Eller pratar du om att kontrollera om deras distribution är samma / olika?
  • Jag är inte säker !! För det är det jag vill veta.! Ska vi inte leta efter båda för att bestämma ” dessa två exempelgrupper är olika eller inte ” i alla aspekter? Jag kunde inte hitta någon handledning som lyfte fram den här vyn .. De flesta självstudier förklarar som ” … för att jämföra mer än två grupper, gå till F-test .. .. ”. Den tiden ändras synpunkten från ” tittar på medelvärdet ” till ” tittar på varians !! ” .. Därför är jag inte klar över detta!
  • Som ny student i stat vet jag inte vad jag ska se upp för! .. mest av självstudier säger .. ” T-test ELLER F-test ” .. ingen av handledningen sa ” kolla efter både T OCH F !! (min åsikt: Ska vi inte ’ t titta från båda vinklarna? (dvs. medel såväl som avvikelser)?
  • Länken nedan går där: Jag har hänvisat det redan. Men inte exakt svarar det på min fråga): stats.stackexchange.com/questions/78150/…
  • Tja, att göra ett ” test ” är att hitta svaret på en fråga. Det första du behöver veta är vad den faktiska frågan är!

Svar

Termerna t-test och F-Test är tvetydiga, för varje test där teststatistiken har en t-fördelning (under nollhypotesen) kallas t-test och varje test där teststatistiken har en F-distribution kallas F-test. Det finns mer än en förekomst av dessa.

Detta är relevant för din fråga eftersom det finns ett F-test som jämför varianterna av två prover, men det här är inte F -test som används i standard ANOVA-analys. I själva verket jämför ANOVA F-testet mellan grupp- och gruppvariationer, och variabilitet mellan grupper mäts faktiskt genom att kvadrera och summera skillnader mellan gruppmedel, så i denna inställning handlar både t- och F-test om att jämföra grupp betyder. Om du bara har två grupper / faktornivåer är F-teststatistiken kvadraten för t-teststatistiken, och F-testet motsvarar det dubbelsidiga t-testet. För mer än två grupper är problemet med t-test att t-testet bara kan jämföra två grupper samtidigt, vilket innebär att du behöver flera t-test för att jämföra alla grupper, vilket involverar problem med flera test (dvs. om du testa flera hypoteser på 5% -nivå, sannolikheten att hitta minst en felaktighet under förutsättning att alla nollhypoteser är sanna kan vara väsentligt högre än 5%).

Dessutom har du rätt i att man kan vara intresserad av att utforska både skillnader mellan medel och skillnader mellan avvikelser, och grupper med samma medelvärde kan fortfarande ha olika avvikelser. Du kan verkligen kontrollera dem båda, även om detta igen innebär flera test; det finns ingen gratis lunch. I många applikationer av ANOVA är det antingen ganska rimligt att anta lika avvikelser, eller bara menar skillnader är av stort intresse (t.ex. bara undrar om en grupp presterar ”bättre” än en annan), därför är skillnader i avvikelser undersöks ofta inte uttryckligen (jag kommer att avstå från ett uttalande om huruvida detta skulle vara ”bra” eller ”korrekt”; eller snarare skulle mitt svar vara ”det beror” …).

Kommentarer

  • Tack för förklaringen

Svar

Om du jämför mer än två grupper och är intresserade av att jämföra deras medel är det vanligt att göra ANOVA som du säger som testar hypotesen att alla gruppmedel är lika. Gör flera $ t $ -tests är inte riktigt ekvivalenta eftersom varje test bara tester om medelvärdet i de två grupperna är lika. Din punkt 1)

Användningen av $ F $ test till c ompare-avvikelser används eftersom det du jämför i ANOVA är variansen mellan gruppmedlen kontra variansen inom grupperna. (Din punkt 3)

Återstoden av dina frågor är svåra att besvara för, se mina punkter ovan, jag tror att du har några missuppfattningar om precis vad som händer.

Svar

Tänk på denna formel

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. ur praktisk synvinkel detta kan vara sant korrekt.

2.Om du har en kontroll och behandlad grupp bildar samma befolkning kommer de att vara desamma. Men säg om du har pojkar mot tjejer, plats1 mot plats2, kan de vara annorlunda.

  1. Rätt.
  2. Eventuellt
  3. Beroende på ditt mål. Om du bara vill veta om gruppen har olika egenskaper (som genomsnittet), t-test. Om du vill veta om vissa tillämpade faktorer (som olika nivåer av cigarettens nikotin) har betydande effekter, använd F-test.
  4. Formeln är relaterad men applikationen skiljer sig beroende på ditt mål .

  5. Nej eftersom det inte är vettigt eftersom t- och F-test har olika mål eller problem de löser.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *