Studio statistica per la scienza dei dati da pochi mesi ..

1) Lo sto imparando, quando dobbiamo confrontare più campioni (> 2) quindi un test T sarebbe noioso e invece andiamo per ANOVA e conduciamo un “test F”.

2) Sopra la comprensione crea un “requisito mutuamente esclusivo tra il test F e il test T”.

3) Ho anche imparato che, il test T (sia esso: 1 sample / paired / 2 sample) fondamentalmente verifica le differenze nelle medie mentre “F test” verifica le differenze nelle varianze.

4) Supponiamo ora che due gruppi di campioni abbiano medie quasi uguali ma varianze molto diverse, quindi , entrambi i test darebbero risposte diverse, giusto?

T test direbbe “non sono differenti”. Ma “F test” direbbe “sono diversi”.

O anche per un caso inverso. (mezzi estremamente diversi, ma quasi le stesse varianze) ..

5) Quindi, in base a cosa (la media? o la varianza?) decideremo finalmente la loro vera differenza?

6) Quindi la domanda è: come sono correlati? Se lobiettivo originale era scoprire che due o più campioni sono diversi o no, allora il modo in cui “cercare mezzi” (ovvero scegliere il test T) per un numero minore di gruppi di campioni viene modificato in “cercare le varianze” quando nessun gruppo di campioni sono> 2? (Quando il fatto è: la varianza e la media sono caratteristiche fondamentalmente indipendenti di un gruppo campione)

7) Non dovrebbero queste entrambe le metriche essere controllate per scoprire se i due campioni sono veramente diversi o no?

(Ho menzionato i numeri di serie nei punti che ho indicato. Indica gentilmente se qualcuno di essi è una comprensione fondamentalmente sbagliata. Apprezzerei se fossero fornite risposte per ogni punto)

Commenti

  • Che cosa intendi esattamente per ” confronto di campioni “? Stai parlando di confrontare se la media della popolazione da cui provengono è la stessa / diversa? O stai parlando di controllare se la loro distribuzione è la stessa / diversa?
  • Non ne sono sicuro !! Perché è quello che voglio sapere.! Non dovremmo cercare entrambi per decidere ” che questi due gruppi campione sono diversi o no ” in tutti gli aspetti? Non sono riuscito a trovare nessun tutorial che evidenziasse questa vista .. La maggior parte dei tutorial spiegano come ” … per confrontare più di due gruppi, vai al test F .. .. “. Quella volta il punto di vista cambia da ” guardando la media ” a ” guardando le varianze !! ” .. Quindi non sono chiaro su questo!
  • Come nuovo studente di statistica, non so cosa cercare! .. la maggior parte dei tutorial dicono .. ” test T O test F ” .. nessuno dei tutorial ha detto ” controlla sia T che F !! (la mia opinione: non dovremmo ‘ guardare da entrambi gli angoli? (cioè le medie e le varianze)?
  • Il tipo di collegamento seguente va lì: Lho già segnalato. Ma non risponde esattamente alla mia domanda): stats.stackexchange.com/questions/78150/…
  • Bene, fare un ” test ” è trovare la risposta a una domanda. La prima cosa che devi sapere è qual è la vera domanda!

Risposta

I termini t-test e F-Test sono ambigui, perché qualsiasi test in cui la statistica del test ha una distribuzione t (sotto lipotesi nulla) è chiamato t-test e qualsiasi test in cui la statistica del test ha una distribuzione F è chiamato F-test. Ci sono più di un caso di questi.

Questo è pertinente alla tua domanda perché esiste un test F che confronta le varianze di due campioni, ma questo non F -test utilizzato nellanalisi ANOVA standard. In effetti, il test ANOVA F confronta la variabilità tra gruppi e allinterno del gruppo, e la variabilità tra gruppi viene infatti misurata quadrando e sommando le differenze tra le medie del gruppo, quindi in questa configurazione sia i test t che quelli F riguardano il confronto gruppo significa. In effetti, se hai solo due gruppi / livelli di fattore, la statistica del test F è il quadrato della statistica del test t e il test F è equivalente al test t bilaterale. Per più di due gruppi il problema con i test t è che il test t può confrontare solo due gruppi contemporaneamente, il che significa che avrai bisogno di diversi test t per confrontare tutti i gruppi, coinvolgendo problemi con test multipli (cioè, se tu testare diverse ipotesi al livello del 5%, la probabilità di trovare almeno un significato errato assumendo che le ipotesi nulle siano tutte vere può essere sostanzialmente superiore al 5%).

Inoltre, hai ragione sul fatto che uno potrebbe essere interessato ad esplorare sia le differenze tra le medie che le differenze tra le varianze, e i gruppi con la stessa media potrebbero ancora avere varianze diverse. Puoi effettivamente controllarli entrambi, sebbene ciò implichi ancora più test; non cè pranzo gratis. In molte applicazioni di ANOVA è abbastanza ragionevole presumere varianze uguali o solo differenze medie sono di interesse sostanziale (ad esempio, chiedersi solo se un gruppo si comporta “meglio” di un altro), quindi differenze nelle varianze spesso non vengono indagati in modo esplicito (mi asterrò da una dichiarazione sul fatto che questo sia “buono” o “corretto”; o piuttosto la mia risposta sarebbe “dipende” …).

Commenti

  • Grazie per la spiegazione

Rispondi

Se tu stanno confrontando più di due gruppi e sono interessati a confrontare le loro medie, quindi è normale fare ANOVA come dici tu che verifica lipotesi che tutte le medie del gruppo siano uguali. Fare più $ t $ -tests non è del tutto equivalente perché ogni test verifica solo se le medie in questi due gruppi sono uguali. Il tuo punto 1)

Luso del $ Test F $ per c Viene utilizzato ompare variances perché ciò che si confronta in ANOVA è la varianza tra le medie del gruppo rispetto alla varianza allinterno dei gruppi. (Il tuo punto 3)

È difficile rispondere al resto delle tue domande perché, vedi i miei punti sopra, penso che tu abbia alcuni concetti errati su quello che sta succedendo.

Risposta

Considera questa formula

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. dal punto di vista della praticità potrebbe essere vero corretto.

2. Se hai un gruppo di controllo e trattato dalla stessa popolazione, allora saranno gli stessi. Ma supponiamo che tu abbia ragazzi contro ragazze, posizione1 contro posizione2, potrebbero essere diversi.

  1. Corretto.
  2. Forse
  3. A seconda del tuo obiettivo. Se vuoi semplicemente sapere se il gruppo ha caratteristiche diverse (come la media), allora t-test. Se vuoi sapere se alcuni fattori applicati (come i diversi livelli di nicotina delle sigarette) hanno effetti significativi, usa il test F.
  4. La formula è correlata ma lapplicazione differisce a seconda del tuo obiettivo .

  5. No. poiché non ha alcun senso poiché i test te F hanno obiettivi o problemi diversi che stanno risolvendo.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *