Să presupunem că avem următorul set de date:

 Men Women Dieting 10 30 Non-dieting 5 60 

Dacă Execut testul exact Fisher în R, atunci ce presupune alternative = greater (sau mai puțin)? De exemplu:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Am p-value = 0.01588 și odds ratio = 3.943534 . De asemenea, când răsfoiesc rândurile tabelului de contingență astfel:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

atunci primesc p-value = 0.9967 și odds ratio = 0.2535796. Dar, când rulez cele două tabele de contingență fără argumentul alternativ (adică fisher.test(mat)), atunci primesc p-value = 0.02063.

  1. Ați putea să-mi explicați motivul?
  2. De asemenea, care este ipoteza nulă și ipoteza alternativă în cazurile de mai sus?
  3. Pot rula testul Fisher pe un tabel de contingență ca acesta:

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PS: Nu sunt statistic. Încerc să învăț statistici, astfel încât ajutorul dvs. (răspunsuri în engleză simplă) ar fi foarte apreciat.

Răspuns

greater (sau less) se referă la un test unilateral care compară o ipoteză nulă că p1=p2 la alternativa p1>p2 (sau p1<p2). În contrast, un test pe două fețe compară ipotezele nule cu alternativa că p1 nu este egal cu p2.

Pentru masa dvs., proporția persoanelor care tin dieta sunt bărbați este 1/4 = 0,25 (10 din 40) în eșantion. Pe de altă parte, proporția bărbaților care nu fac dietă este de 1/13 sau (5 din 65) egală cu 0,077 în eșantion. Deci, estimarea pentru p1 este 0,25, iar pentru p2 este 0,077. Prin urmare, se pare că p1>p2.

De aceea pentru alternativa unilaterală p1>p2 valoarea p este 0,01588. (Valorile p mici indică faptul că ipoteza nulă este puțin probabilă și alternativa este probabilă.)

Când alternativa este p1<p2 vedem că datele dvs. au indicat că diferența este în direcția greșită (sau neprevăzută).

De aceea, în acest caz, valoarea p este atât de mare 0,9967. Pentru alternativa cu două fețe, valoarea p ar trebui să fie puțin mai mare decât pentru alternativa unilaterală p1>p2. Și într-adevăr, are o valoare p egală cu 0,02063.

Comentarii

  • Explicație fantastică. Deci, testul exact al pescarului compară de fapt probabilitățile între rânduri spre deosebire de coloane?
  • @Christian: Nu, nu contează dacă rândurile sau coloanele sale ca testul Fisher verifică corelația într-un tabel de urgență. Rândurile și coloanele <

nu contează direct. De asemenea, ați putea reformula doar ipoteza: în schimb H0 fiind " persoanele care fumează mor mai tinere " ați putea presupune și H0: " persoanele care mor mai tinere sunt mai predispuse să fumeze ". Rezultatele testului Fisher vă vor spune dacă orice conexiune observată în date susține ipoteza nulă sau nu, dar nu contează ' care este variabila independentă sau dependentă și în mod egal alegerea rândurilor / coloanelor nu contează ' nu contează 🙂

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *