Hoe kan ik de t-score berekenen zonder het werkelijke populatiegemiddelde te kennen?

Ik studeer nu t-scores. Voor zover ik begrijp, worden t-scores gebruikt wanneer we de werkelijke populatieparameters niet kennen (zoals: standaarddeviatie en populatiegemiddelde) en geen z-scores kunnen gebruiken. Hier is een formule die in boeken en op internet staat voor het berekenen van t -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$

Voor zover ik weet μ wordt gebruikt om het werkelijke populatiegemiddelde te definiëren. Dus in de bovenstaande formule heb ik het werkelijke populatiegemiddelde μ nodig om de t-score te berekenen. Maar zoals ik al eerder zei, wanneer bij het berekenen van de t-score kennen we de ware populatieparameters niet, in dit geval het ware populatiegemiddelde μ. Dus welk nummer moet ik gebruiken in μ en hoe het te berekenen?

Ook om het duidelijk te maken, is het erg handig als je een voorbeeld geeft van de werkelijke t -score berekening.

Opmerkingen

In een hypothesetest is de u de hypothesewaarde.
In wezen een t-toets, je neemt iets voor jou aan. Bereken het gemiddelde van ' s. Gebruik die waarden om de test uit te voeren. Je hoeft ' gewoon niet het echte populatiegemiddelde te hebben.
@Student T Je bedoelt dat ik moet gebruiken voor μ het gemiddelde van veel andere monsters? Maar als ik maar één sample heb (bestaande uit 30 elementen)?
Heb je het over een t-test? In een t-toets is de u de waarde die is opgegeven in de nulhypothese. Deze statistiek probeert echt uw steekproefgemiddelde om te zetten in de standaardtest van normaal naar significantie. Ik denk niet dat ' niet iets te maken heeft met veel andere voorbeelden.
@Student T Ik heb het over de t-score om een geschatte standaardfout te vinden wanneer we niet ' t hebben echte populatieparameters (standaarddeviatie en populatiegemiddelde).

Antwoord

Voor zover ik weet, wordt μ gebruikt om het werkelijke populatiegemiddelde te definiëren.

Niet helemaal, en hier is de wrijving. μ vertegenwoordigt wat het ware gemiddelde ook is. Het is gedefinieerd door het probleem waarvoor dit kleine stukje statistische gevolgtrekking de analyse is, niet door de gegevens zelf (dat zou het een schatting maken, geen hypothese)

Dus in bovenstaande formule heb ik het werkelijke populatiegemiddelde μ nodig om de t-score te berekenen.

Je hebt een hypothese nodig over wat het is, dat wil zeggen: een mogelijke waarde ervoor. U hoeft niet te weten wat die waarde werkelijk is.

Maar zoals ik al eerder zei bij het berekenen van de t-score weten we geen echte populatieparameters, in dit geval is het werkelijke populatiegemiddelde μ. Dus welk getal moet ik gebruiken in μ en hoe moet ik het berekenen?

Een voorbeeld, op een paar manieren gedaan

Ga er even van uit dat je een groep proefpersonen vraagt om de prijs van iets te schatten – bijvoorbeeld een nieuwe school leerboek, voor concreetheid – en je bent geïnteresseerd of ze de werkelijke prijs overschatten of onderschatten.

Hier kun je de werkelijke prijs opzoeken, dus als het 45 dollar is en de prijsschattingen ook in dollars, dan is de μ = 45. Als de gemiddelde schatting van de proefpersonen 60 is, dan is je t-test test of er voldoende bewijs is dat ze de prijs systematisch overschatten of dat hun gissingen afkomstig zouden kunnen zijn van een populatie van onderwerpen die de prijs van het leerboek niet onder noch overschatten.

Dit is een andere volledig gelijkwaardige manier , kunt u de werkelijke prijs aftrekken van de gok van elk onderwerp. Dan kijk je naar afwijkingen van de juiste prijs en de test zou μ = 0 (onbevooroordeelde prijs raden)

Als je naar een derde manier kijkt, zou je kunnen overwegen om deze test voor alle waarden van μ (je zou dit niet echt doen, maar wees geduldig). Voor μs dichtbij de proefpersonen “gemiddeld, zal de test” niet afwijzen “, maar voor μs vrij ver weg van de proefpersonen” gemiddelde, de test zal weigeren dat de gegevens afkomstig zijn van een verdeling met die waarde van μ. Het gebied van μ-waarden waarvoor de test niet afwijst, is in zekere zin het gebied van μ-waarden die “redelijk” zijn in het licht van de gegevens. Dit is een manier om het idee van (en soms zelfs construeren) een betrouwbaarheidsinterval te motiveren. Wanneer het betrouwbaarheidsinterval (het gebied van niet-afgewezen μs) 45 niet overlapt (of nul in de tweede formulering ), dan verwerpen we de hypothese dat deze populatie onbevooroordeeld is in het raden van de prijs in het leerboek.

Elk van deze benaderingen brengt je op een andere manier naar dezelfde plek. Geen van hen vereist dat u de werkelijke waarde van μ kent. De eerste twee zijn degene die in uw geval in overweging moeten worden genomen.

Opmerkingen

Bedankt voor een gedetailleerde uitleg.Nog een verduidelijking, de t-test en de vindwaarde van t voor onze steekproef is toch anders? Voor de t-test gebruiken we de formule die bij mijn vraag staat en voor het vinden van de waarde van t voor onze steekproef gebruiken we de afgekorte t scoretabel dat de waarden toont van t die overeenkomen met verschillende gebieden onder de normale verdeling voor verschillende steekproefgroottes (graden van freadom), heb ik gelijk? Dus om de waarde van t voor onze steekproef te vinden, hebben we alleen de steekproefomvang n nodig, het percentage van het gebied in de staart (of staarten) en afgekort t scoretabel, heb ik gelijk?
Hier is een screenshot van de afgekorte t scoretabel uit mijn leerboek: i.imgur.com/Odbm0Qc.png
Uit de steekproef bereken je a) de vrijheidsgraden, die hier één minder is dan het aantal waarnemingen (n), b) de gemiddelde waarde van de steekproef (X-balk), de steekproef standaarddeviatie (s). Als je een hypothese maakt over het populatiegemiddelde (μ), dan heb je alles klaar om de statistiek (t) te berekenen. Met de ' t-score-tabel ' kun je kiezen uit een aantal verschillende ' niveaus van significantie ' voor uw test.
Stel volgens mijn voorbeeld dat het populatiegemiddelde 45 was (μ = 45). Je krijgt prijzen van tien personen (n = 10) en deze schattingen zijn gemiddeld vijftig (X-balk = 50) met standaarddeviatie vijf (s = 5). Dus de statistiek t is 3,16. In de middelste kolom staan getallen die t in absolute waarde groter moeten zijn dan te weigeren (die μ = 45) in een tweezijdige toets op ' niveau ' 0,05 voor verschillende vrijheidsgraden. Hier heb je n-1 = 9, dus het getal dat groter moet zijn dan 2,262. 3.16 is groter dan dit, dus u kunt p < .05 die μ = 45 afwijzen in de populatie waarvan dit een steekproef is.
Ik kan ook berekenen t score voor individueel element van mijn steekproef, toch? Welke formule moet je ervoor gebruiken t=(X-μ)/S of t=(X-μ)/estimated standard error? Ik denk dat ik de eerste moet gebruiken, klopt dat? In die formules is μ de steekproefomvang, X de elementwaarde, S steekproefstandaarddeviatie .

Antwoord

Er zijn twee verschillende $ \ mu $ “s betrokken hier:

het veronderstelde gemiddelde dat u gebruikt in de teller van uw t-statistiek voor een t-toets (soms aangeduid als $ \ mu_0 $), en
de ware populatiegemiddelde, $ \ mu $.

De t-toets is eigenlijk om te zien of het werkelijke populatiegemiddelde verschilt van het hypothetische gemiddelde – dat wil zeggen, het is een test voor een nul hypothese $ H_0 \!: \, \ mu = \ mu_0 $.

Verwar $ \ mu $ niet met $ \ mu_0 $. Slechts een van de twee is bekend.

Opmerkingen

Antwoord

Opmerkingen

Antwoord

Geef een reactie Antwoord annuleren