Studiuję teraz t-score. O ile rozumiem, t-score jest używany, gdy nie znamy prawdziwych parametrów populacji (takich jak: odchylenie standardowe i średnia populacji) i nie możemy używać wyników z. Oto wzór, który jest w książkach i Internecie do obliczania t -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$
O ile wiem μ
służy do definiowania prawdziwej średniej populacji. Więc we wzorze powyżej potrzebuję prawdziwej średniej populacji μ
, aby obliczyć t-score. Ale jak powiedziałem wcześniej, kiedy obliczając t-score nie znamy prawdziwych parametrów populacji, w tym przypadku prawdziwa średnia populacji μ
. Więc jakiej liczby powinienem użyć w μ
i jak ją obliczyć?
Aby to wyjaśnić, bardzo pomocne będzie podanie przykładu rzeczywistego t – obliczanie wyników.
Komentarze
Odpowiedź
O ile wiem, μ służy do określenia prawdziwej średniej populacji.
Niezupełnie, a oto przecieranie. μ reprezentuje prawdziwą średnią. To jest zdefiniowane przez problem, dla którego ta niewielka część wnioskowania statystycznego jest analizą, a nie przez same dane (które uczyniłyby z tego oszacowanie, a nie hipotezę)
Zatem we wzorze powyżej potrzebuję prawdziwej średniej populacji μ, aby obliczyć t-score.
Potrzebujesz hipotezy na temat tego, co to jest, czyli: możliwej wartości tego. Nie musisz wiedzieć, jaka jest ta wartość.
Ale jak powiedziałem wcześniej przy obliczaniu t-score, nie znamy prawdziwych parametrów populacji w w tym przypadku prawdziwa średnia populacji μ. Jakiej więc liczby użyć w μ i jak ją obliczyć?
Przykład, zrobiony na kilka sposobów
Załóżmy przez chwilę, że pytasz grupę przedmiotów o oszacowanie ceny czegoś – powiedzmy nowa uczelnia podręcznik, dla konkretności – i „interesuje cię, czy oni zawyżają, czy nie doceniają prawdziwej ceny.
Tutaj możesz sprawdzić prawdziwą cenę, więc jeśli wynosi ona 45 dolarów, a cena jest również podawana w dolarach, to μ = 45. Jeśli średnia przypuszczalna wartość badanego wynosi 60, to test t bada, czy jest wystarczająco dużo dowodów na to, że systematycznie zawyżają cenę lub czy ich domysły mogły pochodzić z populacji osób, które ani nie zaniżały, ani nie przeceniały ceny podręcznika.
Patrząc na ten inny, całkowicie równoważny sposób , możesz odjąć prawdziwą cenę od przypuszczenia każdego podmiotu. Następnie patrzysz na odchylenia od prawidłowej ceny, a test ustawiłby μ = 0 (ustalenie bezstronnej ceny)
Patrząc na trzeci sposób, możesz pomyśleć o uruchomieniu tego testu dla wszystkich wartości µ (nie zrobiłbyś tego naprawdę, ale wytrzymaj ze mną). Dla μs bliskich „średniej badanego” test „nie odrzuci”, ale dla μs dość daleko od średniej badanego „test odrzuci , że dane pochodzą z rozkładu o wartości μ. Region wartości μ, dla których test nie odrzuci, jest w pewnym sensie obszarem wartości μ, które są „rozsądne” w świetle danych. Jest to jeden ze sposobów motywowania idei (a czasem nawet konstruowania) przedziału ufności. Kiedy przedział ufności (obszar nieodrzuconych μs) nie nakłada się 45 (lub zero w drugim sformułowaniu) ), to odrzucamy hipotezę, że populacja ta jest bezstronna w swoim podręczniku zgadywania cen.
Każde z tych podejść prowadzi cię w to samo miejsce w inny sposób. Żaden z nich nie wymaga znajomości prawdziwej wartości μ. W twoim przypadku należy wziąć pod uwagę pierwsze dwa.
Komentarze
- Dziękujemy za szczegółowe wyjaśnienie.Jeszcze jedno wyjaśnienie, test t i znalezienie wartości
t
dla naszej próbki jest inne, prawda? Do testu t używamy formuły odpowiadającej mojemu pytaniu, a do znalezienia wartościt
dla naszej próby używamy skróconej tabeli wynikówt
który pokazuje wartościt
odpowiadające różnym obszarom pod rozkładem normalnym dla różnych wielkości próbek (stopnie freadom), czy mam rację? Aby znaleźć wartośćt
dla naszej próbki, potrzebujemy tylko rozmiaru próbkin
, procentu powierzchni ogona (lub ogonów) i skrótu t tabela wyników, mam rację? - Oto zrzut ekranu skróconej tabeli wyników t z mojego podręcznika: i.imgur.com/Odbm0Qc.png
- Z obliczonej próbki a) stopnie swobody, które w tym przypadku są o jeden mniejsze niż liczba obserwacji (n), b) średnia wartość próbki (X-bar), odchylenie standardowe próbki. Kiedy stawiasz hipotezę dotyczącą średniej populacji (μ), masz wszystko gotowe do obliczenia statystyki (t). Tabela ' t-score ' umożliwia wybór spośród kilku różnych ' poziomów istotność ' dla twojego testu.
- Idąc za moim przykładem, załóż hipotezę, że średnia dla populacji wynosi 45 (μ = 45). Otrzymujesz ceny od dziesięciu osób (n = 10), a te przypuszczenia wynoszą średnio pięćdziesiąt (X-bar = 50) z odchyleniem standardowym pięć (s = 5). Zatem statystyka t wynosi 3,16. Środkowa kolumna zawiera liczby, dla których wartość t powinna być większa w wartości bezwzględnej niż wartość do odrzucenia (że μ = 45) w dwustronnym teście na ' poziomie ' 0,05 dla różnych stopni swobody. Tutaj masz n-1 = 9, więc liczba będzie większa niż 2,262. 3.16 jest większe niż to, więc możesz odrzucić p < .05, że μ = 45 w populacji, z której jest to próbka.
- Mogę też obliczyć Wynik dla poszczególnych elementów mojej próbki, prawda? Której formuły użyć do tego
t=(X-μ)/S
czyt=(X-μ)/estimated standard error
? Myślę, że muszę użyć pierwszego, prawda? W tych formułachμ
to rozmiar próbki,X
to wartość elementu,S
przykładowe odchylenie standardowe .
Odpowiedź
W grę wchodzą dwie różne $ \ mu $ „s tutaj:
- hipotetyczna średnia, której używasz w liczniku swojej statystyki t dla testu t (czasami oznaczana jako $ \ mu_0 $), oraz
- prawdziwa średnia populacji, $ \ mu $.
Test t ma na celu sprawdzenie, czy prawdziwa średnia populacji różni się od hipotetycznej średniej – to znaczy jest to test „sa testem dla wartości zerowej hipoteza $ H_0 \!: \, \ mu = \ mu_0 $.
Nie mylić $ \ mu $ z $ \ mu_0 $. Znany jest tylko jeden z nich.
μ
średnia z wielu innych próbek? Ale jeśli mam tylko jedną próbkę (składającą się z 30 elementów)?