Testul F și testul t sunt efectuate în modelele de regresie.

În ieșirea modelului liniar în R, obținem valori ajustate și valori așteptate ale variabilei de răspuns. Să presupunem că am înălțimea ca variabilă explicativă și greutatea corporală ca variabilă de răspuns pentru 100 de puncte de date.

Fiecare variabilă (variabilă explicativă sau independentă, dacă avem model de regresie multiplă) coeficient în modelul liniar este asociată cu o valoare t (împreună cu valoarea sa p)? Cum se calculează această valoare t?

De asemenea, există un test F la final; din nou, sunt curios să aflu despre calculul său?

De asemenea, în ANOVA după modelul liniar, am văzut un test F.

Deși sunt un cursant de statistici noi și nu din mediul statistic. , Am trecut prin multe tutoriale despre asta. Vă rog să nu sugerați să mergeți cu tutoriale de bază, deoarece am făcut deja acest lucru. Sunt curios doar să aflu despre calculul testelor T și F folosind un exemplu de bază.

Comentarii

  • Ce ' sa ' predictor ' variabilă? Din textul dvs., sună de fapt ca și cum ați spune ' variabilă de răspuns '
  • da! variabila de raspuns sau variabila independenta. Îl editez. mulțumesc
  • Whoah. Variabila de raspuns = variabila dependenta = variabila y. Variabila independentă = variabila explicativă = variabila predictor = variabila x. Care este?
  • Mulțumesc Glen_b, sunt încântat de învățarea tipurilor de variabile în modelele de regresie și răspunsul dat mai jos de Maaten mi-a făcut să clarific conceptul.
  • @bioinformatician Aici sunt liste de termeni care vă pot ajuta. Să începem ' s cu sinonime pentru " variabilă dependentă " = " variabilă explicată ", " predict și ", " regressand ", " răspuns ", " endogen ", " rezultat ", " variabilă controlată ". Următoarele sunt câteva sinonime pentru " variabilă explicativă " = " variabilă independentă ", " predictor ", " regresor ", " stimul ", " exogen ", " covariate ", " variabilă de control ". Unii dintre acești termeni sunt mai populari decât alții în diferite discipline.

Răspuns

Neînțelegerea este prima dvs. premisă „Testul F și $ t $ -test sunt efectuate între două populații”, acest lucru este incorect sau cel puțin incomplet. $ T $ -testul care este lângă un coeficient testează ipoteza nulă că acel coeficient este egal cu 0. Dacă variabila corespunzătoare este binară, de exemplu 0 = masculin, 1 = feminin, atunci acesta descrie cele două populații, dar cu complicația adăugată pe care îl ajustați și pentru celelalte covariabile din modelul dvs. Dacă variabila respectivă este continuă, de exemplu ani de educație, vă puteți gândi să comparați pe cineva cu 0 ani de studii cu cineva cu 1 ani de studii și să comparați pe cineva cu 1 ani de studii cu cineva cu 2 ani de studii etc., cu constrângerea că fiecare pas are același efect asupra rezultatului așteptat și din nou cu complicația pe care o ajustați pentru celelalte covariabile din modelul dvs.

Un test F după regresie liniară testează ipoteza nulă că toți coeficienții din modelul dvs., cu excepția constantei, sunt egali cu 0. Deci grupurile pe care le comparați sunt chiar mai complexe.

Comentarii

  • Dragă Maarten Buis! Frumoasă explicație. Votul meu scris pentru tine 🙂 .. scorul meu actual de reputație nu îmi permite să votez 🙁 !!

Răspuns

Unele notații de la început, folosesc z ~ N (0,1), u ~ χ2 (p), v ~ χ2 (q) și z, u și v sunt reciproc independente (condiție importantă)

  1. t = z / sqrt (u / p). Pentru fiecare dintre coeficientul βj, dacă testați dacă h0: βj = 0. Atunci (βj-0) / 1 este practic z, și varianțele eșantionului (n-2) S ^ 2 ~ χ2 (n-2), atunci aveți și partea de jos. Deci, atunci când t este mare, ceea ce înseamnă că deviază de la H0 (valoare p semnificativă) și respingem Ho .
  2. F = (u / p) / (v / q), unde u ar putea avea parametri necentrali λ. Cum obțineți doi χ2 independenți în regresie liniară generală?Estimarea βhat (întregul vector) și varianța eșantionului estimat s ^ 2 sunt întotdeauna independente. Deci, testul F în regresie liniară este practic (SSR / k) / (SSE / (n-k-1)). (SSR: suma pătratelor de regresie SSE: suma pătratelor de eroare). Sub H0: β = 0, partea de sus va avea chi-pătrat central (și, prin urmare, non-central F), altfel va urma statistici de testare necentrale. Deci, dacă doriți să cunoașteți relația dintre t și F, atunci gândiți-vă la regresia liniară simplă. Y = Xb + a (b este un scalar), apoi testul t pentru b și testul general F sunt același lucru.
  3. Pentru (unidirecțional) ANOVA, există o mulțime de lucruri statistice cu privire la matrice de rang X complet și funcții estimabile, nu vreau să vă împovărez cu toate acestea. Dar ideea de bază este, de exemplu, avem 4 tratamente în covid-19 și vrem să comparăm dacă există diferență între cele 4 grupuri. Apoi F = \ sum {n = 1} ^ {4-1} (Fi) / (4-1) pentru total (4-1) contraste ortogonale independente liniar. Deci, dacă F general are un mare valoare, am respinge H0: nicio diferență între 4 grupuri.

Lol Tocmai mi-am dat seama că ai pus această întrebare cu mulți ani în urmă și probabil că nu te mai confuzi. Dar dacă există vreo șansă să „Încă mă interesează, puteți consulta cartea„ Model liniar în statistici ”pentru explicații mai riguroase. Revizuiam cartea pentru calificativul meu și s-a întâmplat să mă lovesc de asta 🙂

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *