Ich studiere jetzt T-Scores. Soweit ich weiß, werden t-Scores verwendet, wenn wir die wahren Populationsparameter (wie Standardabweichung und Populationsmittelwert) nicht kennen und keine z-Scores verwenden können. Hier ist eine Formel, die in Büchern und im Internet zur Berechnung von t steht -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$

Soweit ich weiß μ wird verwendet, um den wahren Populationsmittelwert zu definieren. In der obigen Formel benötige ich den wahren Populationsmittelwert μ, um den t-Score zu berechnen. Aber wie ich bereits sagte, wann Bei der Berechnung des t-Scores kennen wir die wahren Populationsparameter nicht. In diesem Fall bedeutet der wahre Populationsmittelwert μ. Welche Zahl sollte ich also in μ verwenden und wie berechnet man sie?

Um dies zu verdeutlichen, ist es sehr hilfreich, wenn Sie ein Beispiel für das tatsächliche t angeben -score Berechnung.

Kommentare

  • Bei einem Hypothesentest ist das u der Hypothesenwert.
  • Grundsätzlich, wenn Sie dies tun Bei einem T-Test nimmst du etwas für dich an. Berechnen Sie den Durchschnitt der Stichprobe '. Verwenden Sie diese Werte, um den Test durchzuführen. Sie benötigen einfach ' nicht den wahren Populationsmittelwert.
  • @Student T Sie meinen, ich sollte für μ verwenden der Mittelwert vieler anderer Proben? Aber wenn ich nur eine Probe habe (bestehend aus 30 Elementen)?
  • Sprechen Sie über einen T-Test? In einem t-Test ist das u der in der Nullhypothese angegebene Wert. Diese Statistik versucht wirklich, Ihren Stichprobenmittelwert in den Standardtest für Normal- und Signifikanztests umzuwandeln. Ich glaube nicht, dass ' es viele andere Beispiele zu tun hat.
  • @Student TIch spreche über t-Score, um den geschätzten Standardfehler zu finden, wenn wir nicht ' hat keine echten Populationsparameter (Standardabweichung und Populationsmittelwert).

Antwort

Soweit ich weiß, wird μ verwendet, um den wahren Populationsmittelwert zu definieren.

Nicht ganz, und hier ist die Reibung. μ repräsentiert , was auch immer der wahre Mittelwert ist. Es ist definiert durch das Problem, für das dieses kleine bisschen statistische Inferenz die Analyse ist, nicht durch die Daten selbst (das würde es zu einer Schätzung machen, nicht zu einer Hypothese)

In der obigen Formel benötige ich also den wahren Populationsmittelwert μ, um den t-Score zu berechnen.

Sie benötigen eine Hypothese darüber, was es ist, dh einen möglichen Wert dafür. Sie müssen nicht wissen, was dieser Wert wirklich ist.

Aber wie ich bereits sagte, kennen wir bei der Berechnung des t-Scores keine wahren Populationsparameter In diesem Fall bedeutet wahre Population μ. Welche Zahl sollte ich also in μ verwenden und wie berechnet man sie?

Ein Beispiel, das auf verschiedene Arten erstellt wurde

Nehmen Sie für einen Moment an, Sie bitten einen Pool von Fächern, den Preis für etwas zu schätzen – sagen wir ein neues College Lehrbuch, der Vollständigkeit halber – und Sie sind interessiert, ob sie den wahren Preis über- oder unterschätzen.

Hier können Sie den wahren Preis nachschlagen. Wenn es sich also um 45 Dollar handelt und die Preisschätzungen auch in Dollar sind, ist μ = 45. Wenn die durchschnittliche Schätzung der Probanden 60 beträgt, ist Ihr T-Test testet, ob es genügend Beweise dafür gibt, dass sie den Preis systematisch überschätzen, oder ob ihre Vermutungen von einer Population von Probanden stammen könnten, die den Lehrbuchpreis weder unterschätzt noch überschätzt haben.

Betrachten Sie dies auf eine andere völlig gleichwertige Weise Sie können den wahren Preis von der Vermutung jedes Subjekts subtrahieren . Dann betrachten Sie Abweichungen vom korrekten Preis und der Test würde μ = 0 setzen (unvoreingenommene Preisschätzung).

Bei einer dritten Möglichkeit könnten Sie darüber nachdenken, diesen Test für alle -Werte von μ (das würden Sie nicht wirklich tun, aber mit mir aushalten). Für μs in der Nähe des Probanden-Durchschnitts wird der Test „nicht zurückweisen“, aber für μs, die weit vom Probanden-Durchschnitt entfernt sind, der Test wird ablehnen, dass die Daten aus einer Verteilung mit diesem Wert von μ stammen. Der Bereich von μ-Werten, für den der Test nicht zurückweist, ist in gewissem Sinne der Bereich von μ-Werten, die „angemessen“ sind. Dies ist eine Möglichkeit, die Idee eines Konfidenzintervalls zu motivieren (und manchmal sogar zu konstruieren). Wenn sich das Konfidenzintervall (der Bereich der nicht zurückgewiesenen μs) nicht überlappt 45 (oder Null in der zweiten Formulierung) ), dann lehnen wir die Hypothese ab, dass diese Population in ihrer Preisschätzung für Lehrbücher unvoreingenommen ist.

Jeder dieser Ansätze bringt Sie auf unterschiedliche Weise an denselben Ort. Keiner von ihnen erfordert die Kenntnis des wahren Wertes von μ. Die ersten beiden sind diejenigen, die in Ihrem Fall berücksichtigt werden müssen.

Kommentare

  • Vielen Dank für die ausführliche Erklärung.Noch eine Klarstellung, der t-Test und der Befundwert von t für unsere Stichprobe ist anders, oder? Für den t-Test verwenden wir die Formel, die meiner Frage entspricht, und um den Wert t für unsere Stichprobe zu ermitteln, verwenden wir die abgekürzte t Score-Tabelle das zeigt die Werte von t, die verschiedenen Bereichen unter der Normalverteilung für verschiedene Stichprobengrößen (Freadom-Grade) entsprechen, habe ich Recht? Um den Wert t für unsere Stichprobe zu ermitteln, benötigen wir nur die Stichprobengröße n, den Prozentsatz der Fläche im Schwanz (oder den Schwänzen) und abgekürzt t Score-Tabelle, habe ich Recht?
  • Hier ist ein Screenshot der abgekürzten t Score-Tabelle aus meinem Lehrbuch: i.imgur.com/Odbm0Qc.png
  • Aus der Stichprobe berechnen Sie a) die Freiheitsgrade, die hier um eins geringer sind als die Anzahl der Beobachtungen (n), b) den Durchschnittswert der Stichprobe (X-Balken), die Standardabweichung (en) der Stichprobe. Wenn Sie eine Hypothese über den Populationsmittelwert (μ) aufstellen, haben Sie alles bereit, um die Statistik (t) zu berechnen. In der ' t-Score-Tabelle ' können Sie aus verschiedenen ' Ebenen von auswählen Signifikanz ' für Ihren Test.
  • Nach meinem Beispiel wird angenommen, dass der Populationsmittelwert 45 betrug (μ = 45). Sie erhalten Preise von zehn Personen (n = 10) und diese Schätzungen betragen durchschnittlich fünfzig (X-Bar = 50) mit einer Standardabweichung von fünf (s = 5). Die Statistik t ist also 3.16. Die mittlere Spalte gibt Zahlen an, deren absoluter Wert t größer sein sollte als die Zurückweisung (μ = 45) in einem zweiseitigen Test auf ' -Ebene ' 0,05 für verschiedene Freiheitsgrade. Hier haben Sie n-1 = 9, also ist die Zahl größer als 2.262. 3.16 ist größer als dieser Wert, daher können Sie p < .05 ablehnen, dass μ = 45 in der Population ist, aus der dies eine Stichprobe ist.
  • Ich kann auch berechnen t Punktzahl für ein einzelnes Element meiner Stichprobe, richtig? Welche Formel soll dafür verwendet werden t=(X-μ)/S oder t=(X-μ)/estimated standard error? Ich denke, ich muss den ersten verwenden, habe ich recht? In diesen Formeln ist μ die Stichprobengröße, X der Elementwert, S die Standardabweichung der Stichprobe .

Antwort

Es sind zwei verschiedene $ \ mu $ „ beteiligt hier:

  1. der hypothetische Mittelwert, den Sie im Zähler Ihrer t-Statistik für einen t-Test verwenden (manchmal als $ \ mu_0 $ bezeichnet), und
  2. der wahrer Populationsmittelwert, $ \ mu $.

Der t-Test soll tatsächlich feststellen, ob der wahre Populationsmittelwert vom hypothetischen Mittelwert abweicht – das heißt, er ist ein Test für eine Null Hypothese $ H_0 \ !: \, \ mu = \ mu_0 $.

Verwechseln Sie $ \ mu $ nicht mit $ \ mu_0 $. Nur einer der beiden ist bekannt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.