Ora sto studiando i punteggi t. Per quanto ne so, i punteggi t vengono utilizzati quando non conosciamo i parametri reali della popolazione (come: deviazione standard e media della popolazione) e non possiamo utilizzare i punteggi z. Ecco la formula che si trova nei libri e in Internet per calcolare t -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$
Per quanto ne so μ
viene utilizzato per definire la vera media della popolazione. Quindi nella formula sopra ho bisogno della vera media della popolazione μ
per calcolare il t-score. Ma come ho detto prima quando calcolando il punteggio t non conosciamo i veri parametri della popolazione, in questo caso la vera popolazione significa μ
. Quindi quale numero dovrei usare in μ
e come calcolarlo?
Inoltre, per chiarire, sarà molto utile fornire un esempio di t effettivo -calcolo del punteggio.
Commenti
Risposta
Per quanto ne so μ è usato per definire la vera media della popolazione.
Non proprio, e qui “è il problema. μ rappresenta qualunque sia la vera media.” s definito dal problema per il quale questa piccola inferenza statistica è lanalisi, non dai dati stessi (che ne farebbero una stima, non unipotesi)
Quindi nella formula sopra ho bisogno della media della popolazione reale μ per calcolare il t-score.
Hai bisogno di unipotesi su cosa sia, cioè: un possibile valore per esso. Non è necessario sapere quale sia realmente quel valore.
Ma come ho detto prima quando si calcola il t-score non conosciamo i veri parametri della popolazione, in in questo caso, popolazione vera significa μ. Quindi quale numero dovrei usare in μ e come calcolarlo?
Un esempio, eseguito in diversi modi
Supponi per un momento di chiedere a un gruppo di soggetti di stimare il prezzo di qualcosa, ad esempio un nuovo college libro di testo, per concretezza – e ti interessa se sopravvalutano o sottovalutano il vero prezzo.
Qui puoi cercare il prezzo vero, quindi se è 45 dollari e anche le ipotesi di prezzo sono in dollari, allora μ = 45. Se la stima media dei soggetti è 60, il tuo test t sta verificando se ci sono prove sufficienti del fatto che stiano sistematicamente sovrastimando il prezzo o se le loro ipotesi potrebbero provenire da una popolazione di soggetti che non ha né sotto né sopravvalutato il prezzo dei libri di testo.
Guardando questo un altro modo completamente equivalente , potresti sottrarre il vero prezzo dallipotesi di ogni soggetto. Quindi stai osservando le deviazioni dal prezzo corretto e il test imposterebbe μ = 0 (ipotesi di prezzo imparziale)
Considerato un terzo modo, potresti pensare di eseguire questo test per tutti valori di μ (non lo faresti davvero, ma abbi pazienza). Per μs vicino alla media dei soggetti, il test “non rifiuterà”, ma per μs abbastanza lontano dalla media dei soggetti, il test rifiuterà che i dati provengano da una distribuzione con quel valore di μ. La regione dei valori μ per i quali il test non rifiuta è, in un certo senso, la regione dei valori μ che sono “ragionevoli” alla luce dei dati. Questo è un modo per motivare lidea di (e talvolta costruire effettivamente) un intervallo di confidenza. Quando lintervallo di confidenza (la regione dei μs non rifiutati) non si sovrappone a 45 (o zero nella seconda formulazione ), quindi rifiutiamo lipotesi che questa popolazione sia imparziale nellindovinare i prezzi da manuale.
Ciascuno di questi approcci ti porta nello stesso posto in un modo diverso. Nessuno di loro richiede di conoscere il vero valore di μ. I primi due sono quelli da considerare nel tuo caso.
Commenti
- Grazie per la spiegazione dettagliata.Ancora una precisazione, il test t e il valore di
t
per il nostro campione sono diversi, giusto? Per il test t utilizziamo la formula che è alla mia domanda e per trovare il valore dit
per il nostro campione utilizziamo la tabella dei punteggit
abbreviata che mostra i valori dit
corrispondenti a diverse aree sotto la distribuzione normale per varie dimensioni del campione (gradi di freadom), ho ragione? Quindi, per trovare il valore dit
per il nostro campione, abbiamo bisogno solo della dimensione del campionen
, la percentuale dellarea in coda (o code) e abbreviata t tabella dei punteggi, ho ragione? - Ecco uno screenshot della t tabella dei punteggi abbreviata dal mio libro di testo: i.imgur.com/Odbm0Qc.png
- Dal campione si calcola a) i gradi di libertà, che qui è uno in meno del numero di osservazioni (n), b) il valore medio del campione (X-bar), il deviazione standard del campione. Quando fai unipotesi sulla media della popolazione (μ), hai tutto pronto per calcolare la statistica (t). La ' tabella t-score ' ti consente di scegliere tra diversi ' livelli di significatività ' per il tuo test.
- Seguendo il mio esempio, ipotizza che la media della popolazione fosse 45 (μ = 45). Ottieni i prezzi da dieci persone (n = 10) e queste ipotesi sono in media cinquanta (barra X = 50) con deviazione standard cinque (s = 5). Quindi la statistica t è 3,16. La colonna centrale fornisce i numeri per cui t dovrebbe essere maggiore in valore assoluto rispetto a rifiutare (che μ = 45) in un test a due code a ' livello ' 0,05 per vari gradi di libertà. Qui hai n-1 = 9 quindi il numero che deve essere maggiore di è 2.262. 3.16 è maggiore di questo, quindi puoi rifiutare p < .05 che μ = 45 nella popolazione da cui questo è un campione.
- Posso anche calcolare t punteggio per singolo elemento del mio campione, giusto? Quale formula utilizzare per esso
t=(X-μ)/S
ot=(X-μ)/estimated standard error
? Penso di aver bisogno di usare il primo, giusto? In quelle formuleμ
è la dimensione del campione,X
è il valore dellelemento,S
la deviazione standard del campione .
Risposta
Sono coinvolti due diversi $ \ mu $ “ qui:
- la media ipotizzata che usi al numeratore della tua statistica t per un test t (a volte indicato come $ \ mu_0 $), e
- il media della popolazione vera, $ \ mu $.
Il test t serve effettivamente a vedere se la media della popolazione reale differisce dalla media ipotizzata, cioè “è un test per un valore nullo ipotesi $ H_0 \!: \, \ mu = \ mu_0 $.
Non confondere $ \ mu $ con $ \ mu_0 $. Solo uno dei due è noto.
μ
la media di tanti altri campioni? Ma se ho un solo campione (composto da 30 elementi)?