F-testi ja t-testi suoritetaan regressiomalleissa.
Lineaarisessa mallilähdössä R, saamme sovitetut arvot ja odotetut vastemuuttujan arvot. Oletetaan, että minulla on korkeus selittävänä muuttujana ja ruumiinpaino vastemuuttujana 100 datapisteelle.
Jokainen lineaarisen mallin muuttuja (selittävä tai riippumaton muuttuja, jos meillä on useita regressiomalleja) kerroin liittyy t-arvoon (sen p-arvon kanssa)? Kuinka tämä t-arvo lasketaan?
Lisäksi lopussa on yksi F-testi; taas olen utelias tietämään sen laskennasta?
Myös ANOVA: ssa lineaarisen mallin jälkeen olen nähnyt F-testin.
Vaikka olen uusi tilastojen oppija enkä tilastosta , Olen käynyt läpi paljon opetusohjelmia tästä. Älkää ehdottako minun menevän perusopetusohjelmiin, koska olen jo tehnyt sen. Olen vain utelias tietämään T- ja F-testilaskennan käyttämällä joitain perusesimerkkejä.
Kommentit
- Mitä ' sa ' ennustava ' muuttuja? Tekstistäsi kuulostaa siltä, että tarkoitat ' vastemuuttujaa '
- kyllä! vastemuuttuja tai riippumaton muuttuja. Muokkaan sitä. kiitos
- Whoah. Vastemuuttuja = riippuva muuttuja = y-muuttuja. Itsenäinen muuttuja = selittävä muuttuja = ennustava muuttuja = x-muuttuja. Mikä se on?
- Kiitos Glen_b, olen iloinen muuttujatyyppien oppimisesta regressiomalleissa ja alla oleva vastaus, jonka Maaten buis antoi minulle, selkiytti käsitteen.
- @bioinformatician Here ovat luetteloita termeistä, jotka voivat auttaa sinua. Olkoon ' s aloitettava synonyymeillä " riippuvalle muuttujalle " = " selitti muuttujan ", " ennustaa ", " regressand ", " vastaus ", " endogeeninen ", " tulos ", " ohjattu muuttuja ". Seuraavassa on joitain synonyymeja " selittävälle muuttujalle " = " itsenäiselle muuttujalle ", " ennustaja ", " regressori ", " ärsyke ", " eksogeeninen ", " kovariaatti ", " ohjausmuuttuja ". Jotkut näistä termeistä ovat suositumpia kuin toiset eri tieteenaloilla.
Vastaus
Väärinkäsitys on ensimmäinen lähtökohta. ”F-testi ja $ t $ -testi suoritetaan kahden populaation välillä”, tämä on väärä tai ainakin epätäydellinen. Kertoimen vieressä oleva $ t $ -testi testaa nollahypoteesin, jonka mukaan kerroin on 0. Jos vastaava muuttuja on binaarinen, esimerkiksi 0 = mies, 1 = nainen, niin se kuvaa kahta populaatiota, mutta siihen on lisätty komplikaatio. että sopeudut myös muihin mallisi kovariaatteihin. Jos kyseinen muuttuja on jatkuva, esimerkiksi vuosien koulutus, voit miettiä, että verrataan 0-vuotista koulutusta jonkun, jolla on 1-vuotias, ja verrataan 1-vuotista koulutusta 2-vuotiseen jne. rajoitus, että jokaisella vaiheella on sama vaikutus odotettuun lopputulokseen ja jälleen komplikaatio, jonka mukautat mallisi muille kovariaateille.
F-testi lineaarisen regression jälkeen testaa nollahypoteesin, jonka mukaan mallissasi kaikki kertoimet vakiota lukuun ottamatta ovat yhtä suuret kuin 0. Joten vertailemasi ryhmät ovat vielä monimutkaisempia.
Kommentit
- Hyvä Maarten Buis! Hieno selitys. Kirjoitettu äänestykseni sinulle 🙂 ..hetkinen mainepisteet eivät salli minun äänestää 🙁 !!
Vastaa
Joitakin merkintöjä alusta alkaen, I ”m käyttäen z ~ N (0,1), u ~ χ2 (p), v ~ χ2 (q) ja z, u ja v ovat toisistaan riippumattomia (tärkeä ehto)
- t = z / sqrt (u / p). Jos testaat jokaiselle kertoimelle βj, onko h0: βj = 0. Sitten (βj-0) / 1 on pohjimmiltaan z, ja näyte-varianssit (n-2) S ^ 2 ~ χ2 (n-2), niin sinulla on myös alaosa.Jos kun t on suuri, se tarkoittaa, että se poikkeaa H0: sta (merkittävä p-arvo) ja hylkäämme Ho .
- F = (u / p) / (v / q), jossa u: lla voi olla ei-keskeisiä parametreja λ. Kuinka saat kaksi itsenäistä χ2 yleisessä lineaarisessa regressiossa?Arvioitu βhat (koko vektori) ja arvioitu varianssi s ^ 2 ovat aina itsenäisiä. Joten F-testi lineaarisessa regressiossa ovat periaatteessa (SSR / k) / (SSE / (n-k-1)). (SSR: regressioruutujen summa SSE: virheruutujen summa). Kohdassa H0: β = 0, yläosassa on keskellä oleva khi-neliö (ja siten ei-keskeinen F), muuten se seuraa muita kuin keskitettyjä testitilastoja. Joten jos haluat tietää t: n ja F: n välisen suhteen, mieti yksinkertaista lineaarista regressiota. Y = Xb + a (b on skalaari), sitten t-testi b: lle ja kokonais F-testi ovat sama asia.
- (Yksisuuntaiselle) ANOVA: lle on paljon tilastollisia juttuja ei-täysi sijoitus X -matriisi ja arvioitavat funktiot, en halua kuormittaa sinua kaikella. Mutta perusajatus on, että meillä esimerkiksi on 4 hoitoa covid-19: ssä, ja haluamme verrata onko eroja 4 ryhmää. Sitten kokonais F = \ summa {n = 1} ^ {4-1} (Fi) / (4-1) yhteensä (4-1) lineaarisesti riippumattomalle ortogonaaliselle kontrastille. Joten jos kokonais F: llä on suuri arvo, hylkäämme H0: Ei eroa 4 ryhmän välillä.
Lol Tajusin, että kysyit tämän kysymyksen niin monta vuotta sitten ja et todennäköisesti enää hämmentynyt. Mutta jos sinulla on mitään mahdollisuutta ”Olen edelleen kiinnostunut, voit tarkistaa” Lineaarinen malli tilastoissa ”-kirjassa tarkempia selityksiä. Tarkistin kirjaa karsintakilpailuni varten ja sattui törmäämään tähän 🙂