Acum studiez scorurile t. Din câte am înțeles, scorurile t sunt folosite atunci când nu cunoaștem parametrii adevărați ai populației (cum ar fi: deviația standard și media populației) și nu putem folosi scorurile z. Iată formula care se află în cărți și în Internet pentru calcularea t -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$
Din câte știu eu μ
este folosit pentru a defini media adevărată a populației. Deci, în formula de mai sus am nevoie de media adevărată a populației μ
pentru a calcula scorul t. Dar așa cum am spus mai devreme când calculând scorul t nu cunoaștem parametrii adevărați ai populației, în acest caz media adevărată a populației μ
. Deci, ce număr ar trebui să folosesc în μ
și cum să-l calculez?
De asemenea, pentru a clarifica, va fi foarte util dacă furnizați un exemplu de t real -calcul de scor.
Comentarii
Răspuns
Din câte știu, μ este utilizat pentru a defini adevărata medie a populației.
Nu chiar, și aici este frecarea. μ reprezintă oricare ar fi adevărata medie. Este „s definit de problema pentru care acest pic de inferență statistică este analiza, nu de datele în sine (care ar face din aceasta o estimare, nu o ipoteză)
Deci, în formula de mai sus, am nevoie de o adevărată medie a populației μ pentru a calcula scorul t.
Aveți nevoie de o ipoteză despre ce este, adică: o posibilă valoare pentru aceasta. Nu trebuie să știți care este cu adevărat acea valoare.
Dar așa cum am spus mai devreme la calcularea scorului t, nu cunoaștem parametrii adevărați ai populației, în acest caz populație adevărată înseamnă μ. Deci, ce număr ar trebui să folosesc în μ și cum să-l calculez?
Un exemplu, realizat în câteva moduri
Să presupunem pentru o clipă că cereți unui grup de subiecți să estimeze prețul a ceva – spuneți un nou colegiu manual, pentru concretitate – și vă interesează dacă supraestimează sau subestimează prețul adevărat.
Aici puteți căuta prețul adevărat, deci dacă este de 45 de dolari și presupunerea prețului este și în dolari, atunci μ = 45. Dacă media subiecților este de 60, atunci testul dvs. t testează dacă există suficiente dovezi că acestea supraestimează în mod sistematic prețul sau dacă presupunerile lor ar fi putut proveni dintr-o populație de subiecți care nu au subestimat sau supraestimat prețul manualului.
Privind acest lucru un alt mod complet echivalent , puteți scădea prețul adevărat din presupunerea fiecărui subiect. Apoi, vă uitați la abateri de la prețul corect, iar testul ar stabili μ = 0 (estimare imparțială a prețului)
Privit la un al treilea mod, s-ar putea să vă gândiți să rulați acest test pentru toate valorile μ (nu ați face cu adevărat acest lucru, dar aveți grijă de mine). Pentru μs lângă subiecții „medie, testul„ nu va respinge ”, dar pentru μs destul de departe de media subiecților, testul va respinge faptul că datele provin dintr-o distribuție cu acea valoare de μ. Regiunea valorilor μ pentru care testul nu respinge este, într-un anumit sens, regiunea valorilor μ care sunt „rezonabile” în lumina datelor. Aceasta este o modalitate de a motiva ideea (și, uneori, de fapt construi) un interval de încredere. Când intervalul de încredere (regiunea μs ne-respinse) nu se suprapune 45 (sau zero în a doua formulare ), apoi respingem ipoteza că această populație este imparțială în ghicirea prețului manualului.
Fiecare dintre aceste abordări vă duce în același loc într-un mod diferit. Niciunul dintre ei nu necesită cunoașterea adevăratei valori a μ. Primele două sunt cele care trebuie luate în considerare în cazul dvs.
Comentarii
- Vă mulțumim pentru explicații detaliate.O altă clarificare, testul t și valoarea de găsire a
t
pentru eșantionul nostru este diferită, nu? Pentru testul t folosim formula care se pune la întrebarea mea și pentru găsirea valoriit
pentru eșantionul nostru, utilizăm tabelul de scort
prescurtat care arată valorilet
corespunzătoare diferitelor zone sub distribuția normală pentru diferite dimensiuni ale eșantionului (grade de freadom), am dreptate? Deci, pentru a găsi valoareat
pentru eșantionul nostru, avem nevoie doar de dimensiunea eșantionuluin
, procentul de suprafață din coadă (sau cozi) și abreviat T tabelul de scoruri, nu-i așa? - Iată captura de ecran a tabelului de scoruri abreviate din manualul meu: i.imgur.com/Odbm0Qc.png
- Din eșantion calculați a) gradele de libertate, care aici este cu unul mai mic decât numărul de observații (n), b) valoarea medie a eșantionului (X-bar), deviație standard (e) eșantion (e). Când faceți o ipoteză despre media populației (μ), atunci aveți totul pregătit pentru a calcula statistica (t). ' tabelul de scoruri t ' vă permite să alegeți dintre diferite niveluri ' semnificație ' pentru testul dvs.
- Urmând exemplul meu, ipoteza că media populației a fost de 45 (μ = 45). Obțineți prețuri de la zece persoane (n = 10), iar aceste presupuneri sunt în medie cincizeci (X-bar = 50) cu deviație standard cinci (s = 5). Deci statistica t este 3,16. Coloana din mijloc oferă numere care t ar trebui să fie mai mari în valoare absolută decât să respingă (că μ = 45) într-un test cu două cozi la ' nivel ' 0,05 pentru diferite grade de libertate. Aici aveți n-1 = 9, astfel încât numărul să fie mai mare decât este 2,262. 3.16 este mai mare decât acesta, deci puteți respinge p < .05 că μ = 45 în populația din care este un eșantion.
- De asemenea, pot calcula scorul pentru elementul individual al eșantionului meu, nu? Ce formulă să folosiți pentru aceasta
t=(X-μ)/S
saut=(X-μ)/estimated standard error
Cred că trebuie să folosesc primul, nu-i așa? În acele formuleμ
este dimensiunea eșantionului,X
este valoarea elementului,S
deviație standard .
Răspuns
Există două $ \ mu $ „s implicate aici:
- ipoteza înseamnă că utilizați în numeratorul statisticii dvs. t pentru un test t (uneori notat ca $ \ mu_0 $) și
- adevărată medie a populației, $ \ mu $.
Testul t este de fapt pentru a vedea dacă media adevărată a populației diferă de media ipotetică – adică este „un test pentru un nul ipoteza $ H_0 \!: \, \ mu = \ mu_0 $.
Nu confundați $ \ mu $ cu $ \ mu_0 $. Se cunoaște doar unul dintre cele două.
μ
media multor alte probe? Dar dacă am un singur eșantion (format din 30 de elemente)?