Supponiamo di avere il seguente set di dati:
Men Women Dieting 10 30 Non-dieting 5 60
Se Eseguo il test esatto di Fisher in R, quindi cosa significa alternative = greater
(o meno)? Ad esempio:
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
ottengo p-value = 0.01588
e odds ratio = 3.943534
. Inoltre, quando capovolgo le righe della tabella di contingenza in questo modo:
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
, ottengo p-value = 0.9967
e odds ratio = 0.2535796
. Ma, quando eseguo le due tabelle di contingenza senza largomento alternativo (ad esempio, fisher.test(mat)
), ottengo il p-value = 0.02063
.
- Potresti spiegarmi il motivo per favore?
- Inoltre, qual è lipotesi nulla e lipotesi alternativa nei casi precedenti?
-
Posso eseguire il test del pescatore su una tabella di contingenza come questa:
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PS: non sono uno statistico. Sto cercando di imparare le statistiche, quindi il tuo aiuto (risposte in inglese semplice) sarebbe molto apprezzato.
Risposta
greater
(o less
) si riferisce a un test unilaterale che confronta unipotesi nulla che p1=p2
allalternativa p1>p2
(o p1<p2
). Al contrario, un test bilaterale confronta le ipotesi nulle con lalternativa secondo cui p1
non è uguale a p2
.
Per la tua tabella la proporzione di persone a dieta che sono uomini è 1/4 = 0,25 (10 su 40) nel tuo campione. Daltra parte, la proporzione di maschi non a dieta è 1/13 o (5 su 65) pari a 0,077 nel campione. Quindi la stima per p1
è 0,25 e per p2
è 0,077. Pertanto sembra che p1>p2
.
Ecco perché per lalternativa unilaterale p1>p2
il valore p è 0.01588. (Valori p piccoli indicano che lipotesi nulla è improbabile e lalternativa è probabile.)
Quando lalternativa è p1<p2
, vediamo che i tuoi dati indicavano che la differenza è nella direzione sbagliata (o imprevista).
Ecco perché in questo caso il valore p è così alto 0,9967. Per lalternativa bilaterale il valore p dovrebbe essere leggermente superiore a quello dellalternativa unilaterale p1>p2
. E in effetti, è con valore p pari a 0,02063.
Commenti
- Spiegazione fantastica. Quindi, il test esatto di Fisher confronta effettivamente le probabilità tra le righe rispetto alle colonne?
- @Christian: No, non ' importa se le sue righe o colonne come il test Fisher verifica la correlazione in una tabella di contingenza. Righe e colonne non ' sono direttamente importanti. Potresti anche riformulare lipotesi: invece di essere H0 " persone che fumano muoiono più giovani " potresti anche assumere H0: " le persone che muoiono più giovani hanno maggiori probabilità di fumare ". I risultati del test Fisher ti direbbero se una qualsiasi connessione osservata nei dati supporta o meno lipotesi nulla, ma non ' importa quale sia la variabile indipendente o dipendente e ugualmente la scelta di righe / colonne non ' importa 🙂