Supponiamo di poter scegliere tra due catalizzatori differenti. 10 osservazioni sono prese dalla prima e 12 dallaltra. Se $ s_1 = 14 $ e $ s_2 = 28 $, possiamo rifiutare a $ \ alpha = 5 \% $ lipotesi che le varianze siano uguali?

Ecco cosa ha fatto linsegnante:

Il rapporto è: $ s_1 / s_2 = 0,5. $

Quindi

$$ P (F_ {n = 9, m = 11} \ le 0,5) = 0.1538 $$

Quindi dice: il valore p è $ 2 \ times \ min (0.1539; 0.8461) = 0.3074 $ e rifiuta $ H_0 $.

Come ottengo lo 0.1538?

Penso di poter controllare una tabella F per n = 9, m = 11, ma cosa devo fare per ottenere la probabilità che questo valore sia $ \ le 0.5 $?

Commenti

  • Ho risolto un bel po di apparenti errori tipografici. Si prega di controllare la domanda e correggere eventuali malintesi che potrei aver introdotto. In base alle statistiche che fornisci, $ H_0 $ non dovrebbe essere rifiutato.
  • Dipende da quanto sono estese le tue tabelle F e da come ' riorganizzato. In alternativa puoi utilizzare un programma che ha il cdf per la distribuzione F integrato. Ad esempio, in R: pf(.5,9,11) fornisce la risposta [1] 0.1537596
  • @Glen_b, lascia che ' s dica di avere F (.5,9,11). Quello che stai dicendo è che in una tabella come questa socr.ucla.edu/applets.dir/f_table.html , suppongo di trovare la tabella secondaria corretta , quindi guarda n = 9 em = 11 e ottieni la probabilità da lì. Giusto?
  • Quello che hai è una tabella dei valori critici. Fornisce solo aree della coda fino al 10%; puoi usare le proprietà della F per trovare valori di coda più bassi, ma il valore p a una coda più grande che puoi ottenere da quel set di tabelle sarà del 10%. Tutto quello che ' potresti dire è " > 0,1 " anziché " = 0.1538 "
  • Ok. Facciamo finta di ' che domani farò un esame su questo. Come ottengo il mio valore P in una domanda del test F, senza un computer?

Risposta

La prima cosa da notare è che poiché si tratta di un test di varianza, puoi avere F “grandi o piccoli che sono significativi, mentre spesso le tabelle F presumono che tu stia eseguendo calcoli di tipo ANOVA (dove solo valori grandi di F possono causare rigetto).

Quindi è necessario utilizzare il fatto che la coda inferiore di $ F (\ nu_1, \ nu_2) $ è uguale al reciproco della coda superiore di $ F (\ nu_2, \ nu_1 ) $.

Cè “unaltra discussione su questo qui

Come faccio a sapere in quale coda mi trovo? – La mediana di una distribuzione F nei casi di cui dovrai preoccuparti per un test di varianza sarà essere vicino a 1. Quindi, se la statistica F è inferiore a 1, supponi di aver bisogno della coda inferiore. Se è più grande di 1, supponi di aver bisogno della coda superiore.

Nellesempio numerico nella tua domanda, F = 0,5 – vuoi una coda inferiore per F.

Quindi, per trovarlo, devi scambiare i gradi di libertà e i valori F saranno tutti gli inversi di quelli che ti servono. Dato che hai bisogno dellarea inferiore a 0,5, è come trovare larea sopra 1 / 0,5 = 2 su $ F_ {11,9} $.

Quindi devi prima preoccuparti del $ \ alpha $ più alto che riesci a trovare (0,1 nelle tabelle indicate ).

Poiché le tabelle collegate hanno df1 sulle colonne, in questo caso è necessario trovare la colonna 11 e la riga 9.

Non hai un 11, quindi guardiamo 10 e 12:

 ... 10 12 ⁞ 9 2.41632 2.37888 

Allora come gestisci il fatto che non ci sia 11?

Bene, per prima cosa, nota che finché df2 è almeno 3 (e sarà per un test di varianza in un esame), la tabella dei valori critici diminuisce man mano che df aumenta

Quindi, se si stesse ottenendo solo un limite inferiore per il valore p, guardare il successivo df inferiore (ad es. confrontare con df1 = 10 in questo caso).

[Per una maggiore precisione, consulta questo post sullinterpolazione, che discute linterpolazione in gradi di libertà per la F verso la fine. Se il tuo test è incombente dubito che tu abbia tempo per imparare qualcosa di più dellinterpolazione lineare. Ciò suggerisce uninterpolazione lineare nel reciproco dei gradi di libertà.]

Il valore in df1 10, df2 = 9 è 2.41632 che è più grande del tuo 2. Quindi tu “è più vicino a 1 rispetto al valore 0,1.

Il che significa che il valore p della coda più bassa è> 0,1


E se il problema fosse simile a quello della domanda ma la F fosse $ 0,4 $ invece di $ 0,5 $?

1 / 0,4 = 2,5, il che significa che è più in coda rispetto ai due valori di 0,10 sopra (2.41632, 2.37888). Quindi la coda inferiore p < 0.10.

Ora confronta con i valori del 5%. Vediamo che “è inferiore a entrambi i valori 12,9 e 10,9 (che sono entrambi appena sopra 3). Quindi la coda inferiore p> 0,05. Quindi $ 0,05 < p < 0,10 $.

E se il problema fosse simile a quello nella domanda ma la F fosse in between i valori per 10 e 12?

Ora supponiamo che il rapporto F sia 0,323.

Questo è compreso tra il valore 0,05 per 10,9 e 12,9 df – quindi p < 0,05 o> 0,05?

Possibilità 1: diciamo che è circa 0,05.

Possibilità 2: è diciamo che deve almeno il successivo più piccolo (p> 0,025)

Possibilità 3: usa linterpolazione (ma questa volta nel livello di significatività, non la df), come descritto nel link di interpolazione che ho dato prima. Ciò suggerisce uninterpolazione lineare in $ \ log \ alpha $.

Personalmente, se fossi mai stato in grado di fare un test F delle varianze nella pratica *, ma in qualche modo non potessi accedere nemmeno a una calcolatrice (con cui fare una rapida integrazione numerica), sceglierei lopzione 3. Se non potessi farlo per qualche motivo, sceglierei lopzione 1. Tuttavia, le aspettative della persona che la contrassegna potrebbero essere lopzione 2.

* se stavo assumendo potenti allucinogeni, o avessi subito un grave trauma cranico, o qualche altro incidente che in qualche modo non mi rendesse più in grado di apprezzare quale idea davvero pessima sarebbe probabilmente.


Valori p a due code

Sembra che tu voglia semplicemente raddoppiare i valori p a una coda per ottenere quelli a due code.

Va bene fino in fondo, quindi attieniti a quello, ma per una discussione più dettagliata di alcuni problemi, vedi la discussione nellesempio alla fine della risposta qui

[Potrebbe aggiungere ulteriori dettagli in seguito]

Risposta

Innanzitutto, la F la statistica non è il rapporto tra gli sviluppatori std. È il rapporto delle varianze. Quindi, F è 196/784 = 0,25. Il valore p sarebbe quindi 0,047.

Risposta

Se hai bisogno di un valore p a due code puoi utilizzare:

$$ Valore P = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$

dove:

$ F_0 = {S_1 ^ 2 \ over S_2 ^ 2} $

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *