Studiuję teraz t-score. O ile rozumiem, t-score jest używany, gdy nie znamy prawdziwych parametrów populacji (takich jak: odchylenie standardowe i średnia populacji) i nie możemy używać wyników z. Oto wzór, który jest w książkach i Internecie do obliczania t -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$

O ile wiem μ służy do definiowania prawdziwej średniej populacji. Więc we wzorze powyżej potrzebuję prawdziwej średniej populacji μ, aby obliczyć t-score. Ale jak powiedziałem wcześniej, kiedy obliczając t-score nie znamy prawdziwych parametrów populacji, w tym przypadku prawdziwa średnia populacji μ. Więc jakiej liczby powinienem użyć w μ i jak ją obliczyć?

Aby to wyjaśnić, bardzo pomocne będzie podanie przykładu rzeczywistego t – obliczanie wyników.

Komentarze

  • W testowaniu hipotez u jest wartością hipotezy.
  • Zasadniczo, gdy robimy test t, zakładasz coś dla siebie. Oblicz średnią ' próbki. Użyj tych wartości, aby wykonać test. Po prostu nie ' nie potrzebujesz prawdziwej średniej populacji.
  • @Student T Masz na myśli, że powinienem używać dla μ średnia z wielu innych próbek? Ale jeśli mam tylko jedną próbkę (składającą się z 30 elementów)?
  • Czy mówisz o teście t? W teście t u jest wartością określoną w hipotezie zerowej. Ta statystyka naprawdę próbuje przekształcić średnią z próby w standardowe testy od normalnej do istotności. Nie ' nie sądzę, że ma to coś wspólnego z wieloma innymi próbkami.
  • @Student T Mówię o t-score, aby znaleźć szacunkowy błąd standardowy, gdy nie ' t mają prawdziwe parametry populacji (odchylenie standardowe i średnia populacji).

Odpowiedź

O ile wiem, μ służy do określenia prawdziwej średniej populacji.

Niezupełnie, a oto przecieranie. μ reprezentuje prawdziwą średnią. To jest zdefiniowane przez problem, dla którego ta niewielka część wnioskowania statystycznego jest analizą, a nie przez same dane (które uczyniłyby z tego oszacowanie, a nie hipotezę)

Zatem we wzorze powyżej potrzebuję prawdziwej średniej populacji μ, aby obliczyć t-score.

Potrzebujesz hipotezy na temat tego, co to jest, czyli: możliwej wartości tego. Nie musisz wiedzieć, jaka jest ta wartość.

Ale jak powiedziałem wcześniej przy obliczaniu t-score, nie znamy prawdziwych parametrów populacji w w tym przypadku prawdziwa średnia populacji μ. Jakiej więc liczby użyć w μ i jak ją obliczyć?

Przykład, zrobiony na kilka sposobów

Załóżmy przez chwilę, że pytasz grupę przedmiotów o oszacowanie ceny czegoś – powiedzmy nowa uczelnia podręcznik, dla konkretności – i „interesuje cię, czy oni zawyżają, czy nie doceniają prawdziwej ceny.

Tutaj możesz sprawdzić prawdziwą cenę, więc jeśli wynosi ona 45 dolarów, a cena jest również podawana w dolarach, to μ = 45. Jeśli średnia przypuszczalna wartość badanego wynosi 60, to test t bada, czy jest wystarczająco dużo dowodów na to, że systematycznie zawyżają cenę lub czy ich domysły mogły pochodzić z populacji osób, które ani nie zaniżały, ani nie przeceniały ceny podręcznika.

Patrząc na ten inny, całkowicie równoważny sposób , możesz odjąć prawdziwą cenę od przypuszczenia każdego podmiotu. Następnie patrzysz na odchylenia od prawidłowej ceny, a test ustawiłby μ = 0 (ustalenie bezstronnej ceny)

Patrząc na trzeci sposób, możesz pomyśleć o uruchomieniu tego testu dla wszystkich wartości µ (nie zrobiłbyś tego naprawdę, ale wytrzymaj ze mną). Dla μs bliskich „średniej badanego” test „nie odrzuci”, ale dla μs dość daleko od średniej badanego „test odrzuci , że dane pochodzą z rozkładu o wartości μ. Region wartości μ, dla których test nie odrzuci, jest w pewnym sensie obszarem wartości μ, które są „rozsądne” w świetle danych. Jest to jeden ze sposobów motywowania idei (a czasem nawet konstruowania) przedziału ufności. Kiedy przedział ufności (obszar nieodrzuconych μs) nie nakłada się 45 (lub zero w drugim sformułowaniu) ), to odrzucamy hipotezę, że populacja ta jest bezstronna w swoim podręczniku zgadywania cen.

Każde z tych podejść prowadzi cię w to samo miejsce w inny sposób. Żaden z nich nie wymaga znajomości prawdziwej wartości μ. W twoim przypadku należy wziąć pod uwagę pierwsze dwa.

Komentarze

  • Dziękujemy za szczegółowe wyjaśnienie.Jeszcze jedno wyjaśnienie, test t i znalezienie wartości t dla naszej próbki jest inne, prawda? Do testu t używamy formuły odpowiadającej mojemu pytaniu, a do znalezienia wartości t dla naszej próby używamy skróconej tabeli wyników t który pokazuje wartości t odpowiadające różnym obszarom pod rozkładem normalnym dla różnych wielkości próbek (stopnie freadom), czy mam rację? Aby znaleźć wartość t dla naszej próbki, potrzebujemy tylko rozmiaru próbki n, procentu powierzchni ogona (lub ogonów) i skrótu t tabela wyników, mam rację?
  • Oto zrzut ekranu skróconej tabeli wyników t z mojego podręcznika: i.imgur.com/Odbm0Qc.png
  • Z obliczonej próbki a) stopnie swobody, które w tym przypadku są o jeden mniejsze niż liczba obserwacji (n), b) średnia wartość próbki (X-bar), odchylenie standardowe próbki. Kiedy stawiasz hipotezę dotyczącą średniej populacji (μ), masz wszystko gotowe do obliczenia statystyki (t). Tabela ' t-score ' umożliwia wybór spośród kilku różnych ' poziomów istotność ' dla twojego testu.
  • Idąc za moim przykładem, załóż hipotezę, że średnia dla populacji wynosi 45 (μ = 45). Otrzymujesz ceny od dziesięciu osób (n = 10), a te przypuszczenia wynoszą średnio pięćdziesiąt (X-bar = 50) z odchyleniem standardowym pięć (s = 5). Zatem statystyka t wynosi 3,16. Środkowa kolumna zawiera liczby, dla których wartość t powinna być większa w wartości bezwzględnej niż wartość do odrzucenia (że μ = 45) w dwustronnym teście na ' poziomie ' 0,05 dla różnych stopni swobody. Tutaj masz n-1 = 9, więc liczba będzie większa niż 2,262. 3.16 jest większe niż to, więc możesz odrzucić p < .05, że μ = 45 w populacji, z której jest to próbka.
  • Mogę też obliczyć Wynik dla poszczególnych elementów mojej próbki, prawda? Której formuły użyć do tego t=(X-μ)/S czy t=(X-μ)/estimated standard error? Myślę, że muszę użyć pierwszego, prawda? W tych formułach μ to rozmiar próbki, X to wartość elementu, S przykładowe odchylenie standardowe .

Odpowiedź

W grę wchodzą dwie różne $ \ mu $ „s tutaj:

  1. hipotetyczna średnia, której używasz w liczniku swojej statystyki t dla testu t (czasami oznaczana jako $ \ mu_0 $), oraz
  2. prawdziwa średnia populacji, $ \ mu $.

Test t ma na celu sprawdzenie, czy prawdziwa średnia populacji różni się od hipotetycznej średniej – to znaczy jest to test „sa testem dla wartości zerowej hipoteza $ H_0 \!: \, \ mu = \ mu_0 $.

Nie mylić $ \ mu $ z $ \ mu_0 $. Znany jest tylko jeden z nich.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *