Ik studeer nu t-scores. Voor zover ik begrijp, worden t-scores gebruikt wanneer we de werkelijke populatieparameters niet kennen (zoals: standaarddeviatie en populatiegemiddelde) en geen z-scores kunnen gebruiken. Hier is een formule die in boeken en op internet staat voor het berekenen van t -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$
Voor zover ik weet μ
wordt gebruikt om het werkelijke populatiegemiddelde te definiëren. Dus in de bovenstaande formule heb ik het werkelijke populatiegemiddelde μ
nodig om de t-score te berekenen. Maar zoals ik al eerder zei, wanneer bij het berekenen van de t-score kennen we de ware populatieparameters niet, in dit geval het ware populatiegemiddelde μ
. Dus welk nummer moet ik gebruiken in μ
en hoe het te berekenen?
Ook om het duidelijk te maken, is het erg handig als je een voorbeeld geeft van de werkelijke t -score berekening.
Opmerkingen
Antwoord
Voor zover ik weet, wordt μ gebruikt om het werkelijke populatiegemiddelde te definiëren.
Niet helemaal, en hier is de wrijving. μ vertegenwoordigt wat het ware gemiddelde ook is. Het is gedefinieerd door het probleem waarvoor dit kleine stukje statistische gevolgtrekking de analyse is, niet door de gegevens zelf (dat zou het een schatting maken, geen hypothese)
Dus in bovenstaande formule heb ik het werkelijke populatiegemiddelde μ nodig om de t-score te berekenen.
Je hebt een hypothese nodig over wat het is, dat wil zeggen: een mogelijke waarde ervoor. U hoeft niet te weten wat die waarde werkelijk is.
Maar zoals ik al eerder zei bij het berekenen van de t-score weten we geen echte populatieparameters, in dit geval is het werkelijke populatiegemiddelde μ. Dus welk getal moet ik gebruiken in μ en hoe moet ik het berekenen?
Een voorbeeld, op een paar manieren gedaan
Ga er even van uit dat je een groep proefpersonen vraagt om de prijs van iets te schatten – bijvoorbeeld een nieuwe school leerboek, voor concreetheid – en je bent geïnteresseerd of ze de werkelijke prijs overschatten of onderschatten.
Hier kun je de werkelijke prijs opzoeken, dus als het 45 dollar is en de prijsschattingen ook in dollars, dan is de μ = 45. Als de gemiddelde schatting van de proefpersonen 60 is, dan is je t-test test of er voldoende bewijs is dat ze de prijs systematisch overschatten of dat hun gissingen afkomstig zouden kunnen zijn van een populatie van onderwerpen die de prijs van het leerboek niet onder noch overschatten.
Dit is een andere volledig gelijkwaardige manier , kunt u de werkelijke prijs aftrekken van de gok van elk onderwerp. Dan kijk je naar afwijkingen van de juiste prijs en de test zou μ = 0 (onbevooroordeelde prijs raden)
Als je naar een derde manier kijkt, zou je kunnen overwegen om deze test voor alle waarden van μ (je zou dit niet echt doen, maar wees geduldig). Voor μs dichtbij de proefpersonen “gemiddeld, zal de test” niet afwijzen “, maar voor μs vrij ver weg van de proefpersonen” gemiddelde, de test zal weigeren dat de gegevens afkomstig zijn van een verdeling met die waarde van μ. Het gebied van μ-waarden waarvoor de test niet afwijst, is in zekere zin het gebied van μ-waarden die “redelijk” zijn in het licht van de gegevens. Dit is een manier om het idee van (en soms zelfs construeren) een betrouwbaarheidsinterval te motiveren. Wanneer het betrouwbaarheidsinterval (het gebied van niet-afgewezen μs) 45 niet overlapt (of nul in de tweede formulering ), dan verwerpen we de hypothese dat deze populatie onbevooroordeeld is in het raden van de prijs in het leerboek.
Elk van deze benaderingen brengt je op een andere manier naar dezelfde plek. Geen van hen vereist dat u de werkelijke waarde van μ kent. De eerste twee zijn degene die in uw geval in overweging moeten worden genomen.
Opmerkingen
- Bedankt voor een gedetailleerde uitleg.Nog een verduidelijking, de t-test en de vindwaarde van
t
voor onze steekproef is toch anders? Voor de t-test gebruiken we de formule die bij mijn vraag staat en voor het vinden van de waarde vant
voor onze steekproef gebruiken we de afgekortet
scoretabel dat de waarden toont vant
die overeenkomen met verschillende gebieden onder de normale verdeling voor verschillende steekproefgroottes (graden van freadom), heb ik gelijk? Dus om de waarde vant
voor onze steekproef te vinden, hebben we alleen de steekproefomvangn
nodig, het percentage van het gebied in de staart (of staarten) en afgekort t scoretabel, heb ik gelijk? - Hier is een screenshot van de afgekorte t scoretabel uit mijn leerboek: i.imgur.com/Odbm0Qc.png
- Uit de steekproef bereken je a) de vrijheidsgraden, die hier één minder is dan het aantal waarnemingen (n), b) de gemiddelde waarde van de steekproef (X-balk), de steekproef standaarddeviatie (s). Als je een hypothese maakt over het populatiegemiddelde (μ), dan heb je alles klaar om de statistiek (t) te berekenen. Met de ' t-score-tabel ' kun je kiezen uit een aantal verschillende ' niveaus van significantie ' voor uw test.
- Stel volgens mijn voorbeeld dat het populatiegemiddelde 45 was (μ = 45). Je krijgt prijzen van tien personen (n = 10) en deze schattingen zijn gemiddeld vijftig (X-balk = 50) met standaarddeviatie vijf (s = 5). Dus de statistiek t is 3,16. In de middelste kolom staan getallen die t in absolute waarde groter moeten zijn dan te weigeren (die μ = 45) in een tweezijdige toets op ' niveau ' 0,05 voor verschillende vrijheidsgraden. Hier heb je n-1 = 9, dus het getal dat groter moet zijn dan 2,262. 3.16 is groter dan dit, dus u kunt p < .05 die μ = 45 afwijzen in de populatie waarvan dit een steekproef is.
- Ik kan ook berekenen t score voor individueel element van mijn steekproef, toch? Welke formule moet je ervoor gebruiken
t=(X-μ)/S
oft=(X-μ)/estimated standard error
? Ik denk dat ik de eerste moet gebruiken, klopt dat? In die formules isμ
de steekproefomvang,X
de elementwaarde,S
steekproefstandaarddeviatie .
Antwoord
Er zijn twee verschillende $ \ mu $ “s betrokken hier:
- het veronderstelde gemiddelde dat u gebruikt in de teller van uw t-statistiek voor een t-toets (soms aangeduid als $ \ mu_0 $), en
- de ware populatiegemiddelde, $ \ mu $.
De t-toets is eigenlijk om te zien of het werkelijke populatiegemiddelde verschilt van het hypothetische gemiddelde – dat wil zeggen, het is een test voor een nul hypothese $ H_0 \!: \, \ mu = \ mu_0 $.
Verwar $ \ mu $ niet met $ \ mu_0 $. Slechts een van de twee is bekend.
μ
het gemiddelde van veel andere monsters? Maar als ik maar één sample heb (bestaande uit 30 elementen)?