Od kilku miesięcy studiuję statystykę do nauki o danych ..

1) Dowiaduję się tego, kiedy musimy porównać wiele próbek (> 2), wtedy test T byłby żmudny i zamiast tego idziemy do ANOVA i przeprowadzamy „test F”.

2) Powyższe zrozumienie tworzy „wzajemnie wykluczające się wymaganie między testem F i testem T.”.

3) Nauczyłem się również, że test T (czy to: 1 próbka / para / 2 próbki) zasadniczo testuje różnice średnich, podczas gdy „test F” sprawdza różnice w odchyleniach.

4) Załóżmy teraz, że dwie grupy próbek mają prawie równe średnie, ale bardzo różne wariancje, a następnie , oba testy dałyby różne odpowiedzi, prawda?

Test T powiedziałby „nie są różne”. Ale „test F” powiedziałby „są różne”.

Lub nawet dla odwrotnego przypadku. (bardzo różne środki, ale prawie takie same wariancje) ..

5) Więc na podstawie czego (średniej? czy wariancji?) ostatecznie zdecydujemy o ich prawdziwej różnicy?

6) Pytanie brzmi: jak są one powiązane? Jeśli pierwotnym celem było ustalenie, że dwie lub więcej próbek jest różnych lub nie, to sposób, w jaki „szukanie średnich” (tj. Wybór testu T) dla mniejszej liczby grup próbek, zmienia się na „szukanie wariancji”, gdy nie ma grup próbek są> 2? (Kiedy faktem jest: wariancja i średnia są w zasadzie niezależnymi cechami grupy próbnej)

7) Czy nie powinno się sprawdzać tych obu wskaźników w celu ustalenia, czy rzeczywiście dwie próbki są różne, czy nie?

(Wymieniłem numery seryjne w punktach, które podałem. Zwróć uwagę, jeśli którykolwiek z nich jest zasadniczo błędnym zrozumieniem. Byłbym wdzięczny, gdyby podano odpowiedzi dla każdego punktu)

Komentarze

  • Co dokładnie masz na myśli, mówiąc ” porównując próbki „? Czy mówisz o porównaniu, czy średnia populacji, do której przybywają, jest taka sama / inna? A może mówisz o sprawdzeniu, czy ich dystrybucja jest taka sama / inna?
  • Nie jestem pewien !! Ponieważ to właśnie chcę wiedzieć.! Czy nie powinniśmy szukać obu, aby zdecydować, ” te dwie grupy próbek są różne, czy nie ” we wszystkich aspektach? Nie udało mi się znaleźć żadnego samouczka, który podkreślałby ten widok .. Większość tutoriali wyjaśnia, jak ” … aby porównać więcej niż dwie grupy, przejdź do testu F. .. „. Tym razem punkt widzenia zmienia się z ” patrząc na średnią ” na ” patrząc na wariancje !! ” .. Dlatego nie jestem tego pewien!
  • Jako nowy student statystyki nie wiem, na co zwrócić uwagę! .. większość z samouczków mówi… ” T test OR F test ” .. żaden z samouczków nie powiedział ” sprawdź zarówno T ORAZ F !! (moja opinia: czy nie powinniśmy ' czy patrzeć z obu stron? (tj. zarówno średnie, jak i wariancje)?
  • Poniższe łącze prowadzi tam: Już go poleciłem. Ale nie do końca odpowiada na moje pytanie): stats.stackexchange.com/questions/78150/…
  • Cóż, wykonanie ” testu ” polega na znalezieniu odpowiedzi na pytanie. Pierwszą rzeczą, którą musisz wiedzieć, jest właściwe pytanie!

Odpowiedź

Terminy t-test i test F są niejednoznaczne, ponieważ każdy test, w którym statystyka testowa ma rozkład t (pod hipotezą zerową), nazywany jest testem t, a każdy test, w którym statystyka testowa ma rozkład F, nazywa się testem F. Jest ich więcej niż jeden.

Jest to istotne dla twojego pytania, ponieważ istnieje test F, który porównuje wariancje dwóch próbek, ale jest to nie F -test używany w standardowej analizie ANOVA. W rzeczywistości test F ANOVA porównuje zmienność między grupową i wewnątrzgrupową, a zmienność między grupami jest w rzeczywistości mierzona przez podniesienie do kwadratu i zsumowanie różnic między średnimi grupowymi, więc w tej konfiguracji zarówno testy t, jak i F dotyczą porównywania grupa oznacza. W rzeczywistości, jeśli masz tylko dwie grupy / poziomy czynników, statystyka testu F jest kwadratem statystyki testu t, a test F jest równoważny dwustronnemu testowi t. W przypadku więcej niż dwóch grup problem z testami t polega na tym, że test t może porównywać tylko dwie grupy naraz, co oznacza, że będziesz potrzebować kilku testów t, aby porównać wszystkie grupy, co wiąże się z problemami z wieloma testami (tj. przetestuj kilka hipotez na poziomie 5%, prawdopodobieństwo znalezienia co najmniej jednej błędnej istotności przy założeniu, że wszystkie hipotezy zerowe są prawdziwe, może być znacznie wyższe niż 5%).

Ponadto masz rację, że ktoś może być zainteresowany zbadaniem zarówno różnic między średnimi, jak i różnic między wariancjami, a grupy o tej samej średniej mogą nadal mieć różne wariancje. Możesz rzeczywiście sprawdzić oba, chociaż to znowu wymaga wielokrotnego testowania; nie ma darmowego lunchu. W wielu zastosowaniach ANOVA rozsądne jest zakładanie równych wariancji lub tylko średnie różnice są istotne (np. tylko zastanawianie się, czy jedna grupa działa „lepiej” niż inna), dlatego różnice w wariancjach często nie są wyraźnie badane (powstrzymam się od stwierdzenia, czy byłoby to „dobre” czy „prawidłowe”; a raczej moja odpowiedź brzmiałaby „to zależy” …).

Komentarze

  • Dziękuję za wyjaśnienie

Odpowiedź

Jeśli porównują więcej niż dwie grupy i są zainteresowani porównaniem ich średnich, wtedy zwykle wykonuje się ANOVA, tak jak mówisz, która sprawdza hipotezę, że wszystkie średnie grupowe są równe. Wykonywanie wielu $ t $ -tests nie jest do końca równoważne, ponieważ każdy test sprawdza tylko wtedy, gdy średnie w tych dwóch grupach są równe. Twój punkt 1)

Użycie $ Test F $ do c Opcja ompare wariancje jest używana, ponieważ to, co porównujesz w ANOVA, to wariancja między średnimi grupowymi a wariancją wewnątrz grup. (Twój punkt 3)

Na pozostałe pytania trudno odpowiedzieć, ponieważ, zobacz moje uwagi powyżej, myślę, że masz błędne wyobrażenia na temat tego, co się dzieje.

Odpowiedź

Rozważ tę formułę

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. z praktycznego punktu widzenia to może być prawda.

2.Jeśli masz grupę kontrolną i grupę leczoną z tej samej populacji, będą one takie same. Ale powiedzmy, że jeśli masz chłopców i dziewczynki, lokalizacja1 kontra lokalizacja2, mogą być inni.

  1. Dobrze.
  2. Prawdopodobnie
  3. W zależności od celu. Jeśli po prostu chcesz wiedzieć, czy grupa ma różne cechy (np. Średnią), wykonaj test t. Jeśli chcesz wiedzieć, czy pewne zastosowane czynniki (takie jak różne poziomy nikotyny w papierosie) mają znaczący wpływ, użyj testu F.
  4. Wzór jest powiązany, ale zastosowanie różni się w zależności od celu .

  5. Nie, ponieważ nie ma to żadnego sensu, ponieważ testy t i F mają inny cel lub problem, który rozwiązują.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *