Studiez statistica pentru știința datelor de câteva luni ..

1) Învăț că, atunci când trebuie să comparăm mai multe eșantioane (> 2), atunci un test T ar fi obositor și, în schimb, mergem pentru ANOVA și efectuăm un „test F”.

2) Înțelegerea de mai sus creează o „cerință care se exclude reciproc între testul F și testul T.”

3) Am învățat, de asemenea, că testul T (fie el: 1 sample / paired / 2 sample) practic testează diferențele în medii, în timp ce testele „F” testează diferențele în variante.

4) Acum, să presupunem că două grupuri de eșantioane au medii aproape egale, dar variații foarte diferite, atunci , ambele teste ar oferi răspunsuri diferite nu?

Testul T ar spune „nu sunt diferite”. Dar „testul F” ar spune „sunt diferite”.

Sau chiar și pentru caz invers. (mijloace extrem de diferite, dar aproape aceleași varianțe) ..

5) Deci, în funcție de ce, (media? sau varianța?) vom decide în cele din urmă adevărata lor diferență?

6) Deci întrebarea este: Cum sunt ele legate? Dacă obiectivul inițial a fost de a afla două sau mai multe eșantioane sunt diferite sau nu, atunci modul în care „căutarea înseamnă” (adică alegerea testului T) pentru un număr mai mic de eșantioane, se schimbă în „căutarea de varianțe” atunci când niciunul dintre eșantioane sunt> 2? (Când adevărul este: varianța și media sunt în esență caracteristici independente ale unui grup de eșantioane)

7) Nu ar trebui verificate aceste două valori pentru a afla dacă cu adevărat cele două eșantioane sunt diferite sau Nu?

(Am menționat numerele de serie la punctele pe care le-am menționat. Vă rugăm să indicați dacă vreuna dintre ele este o înțelegere practic greșită. Aș aprecia dacă sunt date răspunsuri pentru fiecare punct)

Comentarii

  • Ce vrei să spui exact prin ” comparând eșantioane „? Vorbiți să comparați dacă media populației din care provin este aceeași / diferită? Sau vorbiți despre verificarea dacă distribuția lor este aceeași / diferită?
  • Nu sunt sigur !! Pentru că asta vreau să știu.! Nu ar trebui să le căutăm pe amândouă pentru a decide ” aceste două grupuri de eșantioane sunt diferite sau nu ” în toate aspectele? Nu am găsit niciun tutorial care să evidențieze această vizualizare .. Majoritatea tutorialelor explică ca ” … pentru a compara mai mult de două grupuri, mergeți la testul F .. .. „. De data aceasta punctul de vizualizare se schimbă de la ” la media ” la ” privind varianțele !! ” .. Prin urmare, nu știu clar acest lucru!
  • Ca nou student la stat, nu știu la ce să mă uit! .. majoritatea din tutoriale spune .. ” T test OR F test ” .. niciunul din tutoriale nu a spus ” verificați atât T cât și F !! (părerea mea: ‘ nu ar trebui să privim din ambele unghiuri? (adică mijloacele, precum și varianțele)?
  • Legătura de mai jos merge acolo: L-am trimis deja. Dar nu exact îmi răspunde la întrebarea mea): stats.stackexchange.com/questions/78150/…
  • Ei bine, efectuarea unui test ” ” este găsirea răspunsului la o întrebare. Primul lucru pe care trebuie să-l știți este care este întrebarea reală!

Răspuns

Termenii testare t și F-Test sunt ambigue, deoarece orice test în care statistica testului are o distribuție t (sub ipoteza nulă) se numește test t și orice test în care statistica testului are o distribuție F se numește test F. Există mai multe cazuri din acestea.

Acest lucru este relevant pentru întrebarea dvs., deoarece există un test F care compară varianțele a două eșantioane, dar acesta nu este nu F -test utilizat în analiza standard ANOVA. De fapt, testul ANOVA F compară variabilitatea între grup și în interiorul grupului, iar variabilitatea între grupuri este de fapt măsurată prin echilibrarea și însumarea diferențelor dintre medii de grup, astfel încât în această configurație atât testele t, cât și testele F sunt despre grup înseamnă. De fapt, dacă aveți doar două grupuri / niveluri de factor, statistica testului F este pătratul statisticii testului t, iar testul F este echivalent cu testul t față-verso. Pentru mai mult de două grupuri, problema cu testele t este că testul t poate compara două grupuri simultan, ceea ce înseamnă că veți avea nevoie de mai multe teste t pentru a compara toate grupurile, implicând probleme cu teste multiple (de exemplu, dacă testați mai multe ipoteze la un nivel de 5%, probabilitatea de a găsi cel puțin o semnificație greșită presupunând că ipotezele nule sunt adevărate poate fi substanțial mai mare de 5%).

În plus, aveți dreptate că cineva ar putea fi interesat să exploreze atât diferențele dintre medii, cât și diferențele dintre varianțe, iar grupurile cu aceeași medie pot avea în continuare varianțe diferite. Le puteți verifica într-adevăr pe amândouă, deși acest lucru implică din nou testări multiple; nu există prânz gratuit. În multe aplicații ale ANOVA este fie destul de rezonabil să presupunem variații egale, fie doar diferențele medii prezintă un interes substanțial (de exemplu, ne întrebăm doar dacă un grup are performanțe „mai bune” decât altul), prin urmare diferențele de varianță de multe ori nu sunt cercetate în mod explicit (mă voi abține de la o declarație despre dacă acest lucru ar fi „bun” sau „corect”; sau mai bine zis răspunsul meu ar fi „depinde” …).

Comentarii

  • Vă mulțumim pentru explicație

Răspuns

Dacă compară mai mult de două grupuri și sunt interesați de compararea mijloacelor lor, atunci este obișnuit să faci ANOVA pe măsură ce spui care testează ipoteza că toate mijloacele de grup sunt egale. Efectuarea mai multor $ t $ -tests nu este destul de echivalent, deoarece fiecare test se setează numai dacă mediile din aceste două grupuri sunt egale. Punctul dvs. 1)

Utilizarea $ F $ test la c Se compară varianțele, deoarece ceea ce comparați în ANOVA este varianța dintre grupul mediu față de varianța din grupuri. (Punctul 3)

Restul întrebărilor tale sunt greu de răspuns deoarece, vezi punctele mele de mai sus, cred că ai câteva concepții greșite despre exact ce se întâmplă.

Răspuns

Luați în considerare această formulă

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. din punct de vedere practic acest lucru ar putea fi adevărat corect.

2. Dacă aveți un grup de control și un grup tratat formează aceeași populație, atunci aceștia vor fi la fel. Dar spuneți dacă aveți băieți față de fete, locație 1 față de locație 2, acestea ar putea fi diferite.

  1. Corect.
  2. Posibil
  3. În funcție de obiectivul tău. Dacă doriți pur și simplu să știți dacă grupul are caracteristici diferite (cum ar fi media), atunci testați t. Dacă doriți să știți dacă anumiți factori aplicați (cum ar fi nivelurile diferite de nicotină a țigării) au efecte semnificative, utilizați testul F.
  4. Formula este legată, dar aplicația diferă în funcție de obiectivul dvs. .

  5. Nu, deoarece nu are niciun sens, deoarece testul t și F au un scop sau o problemă diferită pe care le rezolvă.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *