Jeg studerer nu t-scores. Så vidt jeg forstår, bruges t-scores, når vi ikke kender sande befolkningsparametre (såsom: standardafvigelse og populationsgennemsnit) og kan ikke bruge z-scores. Her er en formel, der findes i bøger og på internettet til beregning af t -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$

Så vidt jeg ved μ bruges til at definere ægte populationsmiddelværdi. Så i formlen ovenfor har jeg brug for ægte populationsmiddelværdi μ for at beregne t-score. Men som jeg sagde før, hvornår beregning af t-score kender vi ikke sande befolkningsparametre, i dette tilfælde betyder ægte befolkning μ. Så hvilket nummer skal jeg bruge i μ og hvordan man beregner det?

Også for at gøre det klart, vil det være meget nyttigt, hvis du giver et eksempel på faktisk t -score-beregning.

Kommentarer

  • I en hypotesetest er u hypoteseværdien.
  • Dybest set, når man laver en t-test, antager du noget for dig. Beregn prøven ' gennemsnittet. Brug disse værdier til at udføre testen. Du behøver simpelthen ' ikke brug for det sande befolknings gennemsnit.
  • @Student T Du mener, jeg skal bruge til μ middelværdien af mange andre prøver? Men hvis jeg kun har en prøve (bestående af 30 elementer)?
  • Taler du om en t-test? I en t-test er u den værdi, der er angivet i nulhypotesen. Denne statistik forsøger virkelig at omdanne dit stikprøvegennemsnit til standardtest til normalitetstest. Jeg tror ikke ' det har noget at gøre mange andre prøver.
  • @Student TI taler om t-score for at finde estimeret standardfejl, når vi ikke ' t har ægte befolkningsparametre (standardafvigelse og populationsgennemsnit).

Svar

Så vidt jeg ved er μ brugt til at definere ægte populationsgennemsnit.

Ikke helt, og her er gnidningen. μ repræsenterer uanset hvad det sande middel er. Det “s defineret af problemet, som denne lille statistiske slutning er analysen for, ikke af selve dataene (det ville gøre det til et skøn, ikke en hypotese)

Så i formlen ovenfor har jeg brug for et ægte populationsgennemsnit μ for at beregne t-score.

Du har brug for en hypotese om, hvad det er, det vil sige: en mulig værdi for det. Du behøver ikke vide, hvad den værdi virkelig er.

Men som jeg sagde før, når vi beregner t-score, kender vi ikke sande befolkningsparametre, i i dette tilfælde betyder ægte befolkning μ. Så hvilket antal skal jeg bruge i μ og hvordan man beregner det?

Et eksempel, gjort et par måder

Antag et øjeblik, at du beder om, at en gruppe emner estimerer prisen på noget – sig et nyt college lærebog til konkretitet – og du er interesseret i, om de over- eller undervurderer den sande pris.

Her kan du slå den sande pris op, så hvis det er 45 dollars og prisgætterne også er i dollars, så er μ = 45. Hvis fagets gennemsnitlige gæt er 60, er din t-test tester, om der er tilstrækkelig dokumentation for, at de systematisk overvurderer prisen, eller om deres gætter kunne have stammer fra en befolkningspersoner, der hverken undervurderede eller overvurderede lærebogsprisen.

Ser man på en anden helt tilsvarende måde , kan du trække den sande pris fra hvert emnes gæt. Derefter ser du på afvigelser fra den korrekte pris, og testen ville indstille μ = 0 (upartisk prissætning)

Set på en tredje måde, kan du tænke på at køre denne test for alle værdier på μ (du ville ikke virkelig gøre dette, men hold mig). For μs nær forsøgspersonernes “gennemsnit” vil testen “ikke afvise”, men for μs ganske langt væk fra fagets “gennemsnit, testen vil afvise, at dataene kommer fra en distribution med den værdi på μ. Området med μ-værdier, som testen ikke afviser for, er på en måde det område med μ-værdier, der er “rimelige” i lyset af dataene. Dette er en måde at motivere ideen om (og undertiden faktisk konstruere) et konfidensinterval. Når konfidensintervallet (regionen for ikke-afviste μs) ikke overlapper 45 (eller nul i den anden formulering ), så afviser vi hypotesen om, at denne befolkning er upartisk i sin gætte på lærebogspriser.

Hver af disse tilgange fører dig til det samme sted på en anden måde. Ingen af dem kræver at kende den sande værdi af μ. De første to er dem, du skal overveje i dit tilfælde.

Kommentarer

  • Tak for detaljeret forklaring.En afklaring mere, t-testen og finde værdien af t for vores prøve er anderledes, ikke? Til t-test bruger vi formlen, der er ved mit spørgsmål, og for at finde værdien t til vores prøve bruger vi forkortet t scoretabel der viser værdierne for t svarende til forskellige områder under normalfordelingen for forskellige stikprøvestørrelser (grader af freadom), har jeg ret? Så for at finde værdien på t til vores prøve behøver vi kun prøvestørrelse n, procentdelen af arealet i halen (eller haler) og forkortet t score tabel, har jeg ret?
  • Her er screenshot af forkortet t score tabel fra min lærebog: i.imgur.com/Odbm0Qc.png
  • Fra prøven beregner du a) frihedsgraderne, som her er en mindre end antallet af observationer (n), b) prøveens gennemsnitlige værdi (X-bar), prøve standardafvigelse (r). Når du laver en hypotese om befolkningens middelværdi (μ), har du alt klar til at beregne statistikken (t). ' t-score tabel ' giver dig mulighed for at vælge mellem forskellige ' niveauer af betydning ' for din test.
  • Efter mit eksempel antager du, at befolkningens gennemsnit var 45 (μ = 45). Du får priser fra ti personer (n = 10), og disse gætter er gennemsnitligt halvtreds (X-bar = 50) med standardafvigelse fem (s = 5). Så statistikken t er 3,16. Den midterste kolonne giver tal, som t skal være større i absolut værdi end at afvise (at μ = 45) i en tosidet test på ' niveau ' 0,05 for forskellige frihedsgrader. Her har du n-1 = 9, så tallet skal være større end 2.262. 3.16 er større end dette, så du kan afvise p < .05 at μ = 45 i den population, hvorfra dette er en prøve.
  • Jeg kan også beregne t score for det enkelte element i min prøve, ikke? Hvilken formel skal bruges til det t=(X-μ)/S eller t=(X-μ)/estimated standard error? Jeg tror, jeg skal bruge den første, har jeg ret? I at formler μ er prøvestørrelse, X er elementværdi, S prøve standardafvigelse .

Svar

Der er to forskellige $ \ mu $ “s involveret her:

  1. den hypotese betyder, at du bruger i tælleren af din t-statistik til en t-test (undertiden betegnet som $ \ mu_0 $), og
  2. ægte populationsgennemsnit, $ \ mu $.

T-testen er faktisk at se, om den sande befolkningsgennemsnit adskiller sig fra det hypotetiske gennemsnit – det vil sige, det er en test for en null hypotese $ H_0 \!: \, \ mu = \ mu_0 $.

Forveksl ikke $ \ mu $ med $ \ mu_0 $. Kun en af de to er kendt.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *