Néhány hónapja tanulmányozom az adattudomány statisztikáit.
1) Megtudom, hogy amikor többször is össze kell hasonlítanunk minták (> 2), akkor egy T-teszt unalmas lenne, és helyette ANOVA-t választunk és elvégezünk egy “F tesztet”.
2) A fenti megértés egyfajta “kölcsönösen kizáró követelményt jelent az F teszt és a T teszt között”.
3) Megtanultam azt is, hogy a T teszt (legyen az: 1 minta / páros / 2 minta) alapvetően az eszközök közötti különbségeket teszteli, míg az “F teszt” a variancia különbségeket teszteli.
4) Most tegyük fel, hogy két mintacsoportnak közel azonos az átlaga, de nagyon eltérőek a szórásai, akkor , mindkét teszt különböző válaszokat adna?
A T teszt azt mondaná, hogy “nem különböznek”. De az “F teszt” azt mondaná, hogy “különböznek”.
Vagy akár fordított esetben is. (nagyon eltérő eszközök, de közel azonos eltérések) ..
5) Tehát mi, (az átlag? vagy a variancia?) alapján fogjuk végül eldönteni a valódi különbségüket?
6) Tehát a kérdés: Hogyan állnak kapcsolatban? Ha az eredeti cél az volt, hogy kiderüljön, két vagy több minta különbözik-e vagy sem, akkor az “eszközkeresés” (azaz a T-teszt kiválasztása) a kisebb mintacsoportok esetében hogyan változik a “szórások keresése” -re, amikor a mintacsoportok száma nincs vannak> 2? (Ha a tény: a variancia és az átlag alapvetően egy mintacsoport független jellemzői)
7) Nem szabad-e ellenőrizni ezeket a két mutatót annak megállapításához, hogy a két minta valóban különbözik-e vagy sem?
(Sorszámokat említettem az általam megfogalmazott pontokhoz. Kérjük, jelezze, ha bármelyikük alapvetően téves megértés. Nagyra értékelném, ha minden pontra válaszokat adnának)
Megjegyzések
- Mit értesz pontosan ” a minták összehasonlításával “? Arról beszél, hogy összehasonlítja, hogy az általuk elért népesség átlaga azonos / különbözik-e? Vagy arról akarsz beszélni, hogy megoszlanak-e azonos / eltérő eloszlásuk?
- Nem vagyok benne biztos !! Mert ezt akarom tudni.! Nem kellene mindkettőt keresnünk annak eldöntéséhez, hogy ” e két mintacsoport minden szempontból különbözik-e vagy sem “? Nem találtam olyan oktatóanyagot, amely kiemelte volna ezt a nézetet. Az oktatóanyagok többsége a következőket magyarázza: ” … ha kettőnél több csoportot hasonlít össze, akkor menjen F tesztre .. .. “. Ekkor a nézőpont ” -ről az átlagos ” -re és ” -re változik, a varianciákat nézve !! ” .. Ezért nem vagyok egyértelmű ebben!
- Új statisztikai hallgatóként nem tudom, mire kell figyelnem! .. legtöbb az oktatóanyagok közül azt mondják .. ” T teszt VAGY F teszt ” .. egyik oktatóanyag sem szólt ” ellenőrizze, hogy vannak-e T és F egyaránt !! (véleményem: Nem kéne, hogy ‘ t mindkét szögből megvizsgáljuk? (azaz az átlagokat és a varianciákat is)?
- Az alábbi link valamilyen módon oda vezet: Már utaltam rá. De nem pontosan ez válaszolja meg a kérdésemet): stats.stackexchange.com/questions/78150/…
- Nos, ha egy ” tesztet készítenek “, megtalálja a választ egy kérdésre. Az első dolog, amit tudnia kell, hogy mi a tényleges kérdés!
Válasz
A t-teszt kifejezések és az F-teszt nem egyértelmű, mert minden olyan tesztet, ahol a tesztstatisztikának t-eloszlása van (a nullhipotézis szerint), t-próbának nevezzük, és minden olyan próbát, ahol a tesztstatisztikának van F-eloszlása, F-próbának nevezzük. Ezeknek egynél több példánya van.
Ez releváns a kérdésed szempontjából, mert van egy F-teszt, amely összehasonlítja két minta varianciáját, de ez nem az F -teszt a standard ANOVA-analízis során használatos. Valójában az ANOVA F-teszt összehasonlítja a csoport és a csoporton belüli variabilitást, és a csoport közötti variabilitást valójában a csoportos átlagok közötti különbségek négyzetes felszámolásával és összegzésével mérik, tehát ebben a beállításban a t- és az F-teszt is az összehasonlításra vonatkozik. csoport jelentése. Valójában, ha csak két csoport / faktor szint van, az F-teszt statisztika a t-teszt statisztika négyzete, az F-teszt pedig egyenértékű a kétoldalas t-próbával. Több mint két csoport esetében a t-tesztekkel az a kérdés, hogy a t-teszt csak két csoportot képes egyszerre összehasonlítani, ami azt jelenti, hogy az összes csoport összehasonlításához több t-tesztre lesz szükséged, amelyek több teszteléssel járnak (például ha teszteljen több hipotézist 5% -os szinten, annak valószínűsége, hogy legalább egy rossz szignifikanciát találjon, feltételezve, hogy a nullhipotézisek mind igazak, lényegesen magasabb lehet 5% -nál).
Ezenkívül igazad van abban, hogy az ember érdeklődhet mind az átlagok, mind a varianciák közötti különbségek feltárásában, és az azonos átlaggal rendelkező csoportok továbbra is eltérhetnek. Valóban ellenőrizheti mindkettőt, bár ez ismét több tesztet is magában foglal; nincs ingyen ebéd. Az ANOVA számos alkalmazásában vagy meglehetősen ésszerű feltételezni az egyenlő varianciákat, vagy csak az átlagos különbségek jelentőséggel bírnak (pl. csak arra kíváncsi, hogy az egyik csoport “jobban” teljesít-e, mint egy másik), ezért eltérések a varianciákban gyakran nem kifejezetten vizsgálják (tartózkodom egy nyilatkozattól, miszerint ez “jó” vagy “helyes” lenne, vagy inkább a válaszom “attól függne” …).
Hozzászólások
- Köszönöm a magyarázatot
Válasz
Ha több mint két csoportot hasonlítanak össze, és érdekelnek az átlaguk összehasonlítása, akkor az ANOVA-t szokás csinálni, amikor elmondja, melyik teszteli azt a hipotézist, miszerint az összes csoport-átlag egyenlő. Több $ t $ -tesztek nem teljesen egyenértékűek, mert minden teszt csak akkor hajt végre teszteket, ha a két csoport átlaga megegyezik. Az Ön pontja 1)
A $ használata F $ teszt c-ig Az ompare varianciákat azért használják, mert amit összehasonlít az ANOVA-ban, az a csoport közötti eltérés a csoportokon belüli varianciával szemben. (A 3. pontod)
A többi kérdésedre nehéz válaszolni, mert lásd a fenti pontjaimat, azt hiszem, vannak téves elképzeléseid arról, hogy mi történik.
Válasz
Fontolja meg ezt a képletet
Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2
- Gyakorlati szempontból ez igaz lehet.
2.Ha van egy kontroll és kezelt csoportja ugyanazon populációból, akkor ugyanazok lesznek. De mondjuk, ha fiúk és lányok vannak, az 1. hely és a 2. hely, akkor azok eltérőek lehetnek.
- Helyes.
- Esetleg
- Céljától függően. Ha egyszerűen meg akarja tudni, hogy a csoportnak más tulajdonságai vannak-e (mint például az átlag), akkor t-próbát. Ha meg akarja tudni, hogy bizonyos alkalmazott tényezők (például a cigaretta különböző nikotinszintjei) jelentős hatással vannak-e, akkor használja az F-tesztet.
-
A képlet kapcsolódik, de az alkalmazás céljától függően eltér .
-
Nem, mivel nincs értelme, mivel a t és az F tesztnek más a célja vagy problémája, mint amit megoldanak.