F test at test se provádí v regresních modelech.

V lineárním modelu výstup v R, dostaneme přizpůsobené hodnoty a očekávané hodnoty proměnné odpovědi. Předpokládejme, že mám výšku jako vysvětlující proměnnou a tělesnou hmotnost jako proměnnou odezvy na 100 datových bodů.

Každá proměnná (vysvětlující nebo nezávislá proměnná, pokud máme model s více regresemi) v lineárním modelu je spojena s hodnotou t (spolu s její hodnotou p)? Jak se počítá tato hodnota t?

Na konci je také jeden test F; znovu jsem zvědavý na jeho výpočet?

Také v ANOVA po lineárním modelu jsem viděl F-test.

I když jsem nový student statistiky a ne ze statistického pozadí „Prošel jsem si spoustou návodů k tomu. Prosím, nenavrhujte, abyste mě chodili se základními návody, protože jsem to již udělal. Zajímalo by mě jen, kdybych věděl o výpočtu testu T a F pomocí nějakého základního příkladu.

Komentáře

  • Co ' sa ' predikční ' proměnná? Z textu to vlastně zní, jako byste mysleli ' proměnnou odpovědi '
  • ano! proměnná odezvy nebo nezávislá proměnná. Upravuji to. děkuji
  • Whoah. Proměnná odpovědi = závislá proměnná = proměnná y. Nezávislá proměnná = vysvětlující proměnná = predikční proměnná = x-proměnná. Co to je?
  • Díky Glen_b, jsem potěšen tím, že se učíme typy proměnných v regresních modelech a odpověď Maaten buis mi dala tento koncept jasně najevo.
  • @bioinformatician zde jsou seznamy termínů, které vám mohou pomoci. Začněme ' s synonymy pro " závislou proměnnou " = " vysvětlil proměnnou ", " predikovat a ", " regresand ", " odpověď ", " endogenní ", " výsledek ", " řízená proměnná ". Dále jsou uvedena některá synonyma pro " vysvětlující proměnnou " = " nezávislou proměnnou ", " prediktor ", " regresor ", " stimul ", " exogenní ", " kovariační ", " řídicí proměnná ". Některé z těchto výrazů jsou v různých oborech populárnější než jiné.

Odpověď

Nedorozumění je vaším prvním předpokladem „F test a $ t $ -test se provádějí mezi dvěma populacemi“, je to nesprávné nebo alespoň neúplné. Test $ t $, který je vedle koeficientu, testuje nulovou hypotézu, že tento koeficient se rovná 0. Pokud je odpovídající proměnná binární, například 0 = muž, 1 = žena, pak to popisuje dvě populace, ale s přidanou komplikací které také upravíte pro ostatní kovariáty ve vašem modelu. Pokud je tato proměnná spojitá, například roky vzdělání, můžete si představit srovnání někoho s 0 lety vzdělání s někým, kdo má 1 rok vzdělání, a srovnání někoho s 1 rokem vzdělání s někým, kdo má 2 roky vzdělání atd., S omezení, že každý krok má stejný účinek na očekávaný výsledek a opět s komplikací, kterou upravíte pro ostatní kovariáty ve vašem modelu.

F-test po lineární regresi testuje nulovou hypotézu, že všechny koeficienty ve vašem modelu kromě konstanty jsou rovny 0. Skupiny, které porovnáváte, jsou tedy ještě složitější.

Komentáře

  • Vážený Maarten Buis! Pěkné vysvětlení. Můj písemný souhlas s vámi 🙂 ..moje současné skóre reputace mi nedovoluje hlasovat 🙁 !!

odpověď

Některé zápisy na samém začátku, používám z ~ N (0,1), u ~ χ2 (p), v ~ χ2 (q) a z, u a v jsou vzájemně nezávislé (důležitá podmínka)

  1. t = z / sqrt (u / p). Pro každý z koeficientů βj, pokud vyzkoušíte, zda h0: βj = 0. Pak (βj-0) / 1 je v zásadě z, a vzorové odchylky (n-2) S ^ 2 ~ χ2 (n-2), pak máte také svoji spodní část. Když je tedy t velké, znamená to, že se odchyluje od H0 (významná hodnota p) a my Ho odmítneme .
  2. F = (u / p) / (v / q), kde u může mít necentrální parametry λ. Jak získáte dvě nezávislé χ2 v obecné lineární regrese?Odhadovaný βhat (celý vektor) a odhadovaná odchylka vzorku s ^ 2 jsou vždy nezávislé. F-test v lineární regresi je tedy v zásadě (SSR / k) / (SSE / (n-k-1)). (SSR: součet čtverců regrese SSE: součet čtverců chyby). Pod H0: β = 0 bude mít vrchol centrální chí-kvadrát (a tedy necentrální F), jinak bude sledovat necentrální statistiku testů. Takže pokud chcete vědět vztah mezi t a F, přemýšlejte o jednoduché lineární regrese. Y = Xb + a (b je skalární), pak t-test pro b a celkový F test jsou totéž.
  3. U (jednosměrné) ANOVA existuje spousta statistických údajů o neplnohodnotná matice X a odhadnutelné funkce, nechci vás tím vším zatěžovat. Ale základní myšlenka je, například máme 4 ošetření v covid-19 a chceme porovnat, zda existuje rozdíl mezi 4 skupiny. Pak celkový F = \ součet {n = 1} ^ {4-1} (Fi) / (4-1) pro celkové (4-1) lineárně nezávislé ortogonální kontrasty. Takže pokud má celkový F velký hodnota, odmítli bychom H0: žádný rozdíl mezi 4 skupinami.

Lol Právě jsem si uvědomil, že jsi tuto otázku položil před tolika lety a nejspíš už nebyl zmatený. Ale pokud existuje nějaká šance, „Stále vás to zajímá, můžete si podrobnější vysvětlení prohlédnout v knize„ Lineární model ve statistikách “. Knihu jsem kontroloval kvůli své kvalifikaci a náhodou jsem do toho narazil 🙂

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *