Ecco la mia query.

Ne ho 6 partecipanti, dove le letture glicemiche vengono effettuate a 30 minuti, 60 … fino a 150 minuti. Pertanto in totale ho 30 punti dati

Per ogni fascia oraria ho calcolato una lettura glicemica media per tutti i 6 partecipanti ad esempio 1. la media dei partecipanti a 30 minuti è 7,96, la SD è 0,92, SEM è 0,38 2. la media dei partecipanti a 60 minuti è 7,68, la SD è 0,93, SEM è 0,38

Gli altri valori SEM sono 0,27 , 0,35, 0,25.

Ora, per un calcolo statistico ho bisogno di calcolare la media ± SEM su tutti i punti di dati .. La media è facile – media solo tutti i 30. Ma per il SEM, se provo per calcolarlo tramite il normale metodo excel, mi ritrovo con un valore di 0,089 .. che nel report mi dà 7,79 ± 0,08. Che è ovviamente troppo piccolo per questo dato che i valori vanno da 6,69 a 9,17.

Cè un calcolo che mi manca? Devo solo sommare / fare la media del SEM per i punti temporali?

Grazie in anticipo!

Sono riuscito a caricare unimmagine della tabella dei dati: Tabella dei dati

Commenti

  • Potresti chiarire esattamente cosa devi segnalare? Come suggerisce @Cherny, il modo esatto in cui lo fai dipende dalla domanda esatta a cui devi rispondere. Se non sei sicuro, fornisci la guida che hai o quale domanda stai cercando di affrontare con questa analisi

Risposta

L errore standard è la deviazione standard di un stimatore ; il SEM si verifica quindi quando si utilizza la media campionaria come stimatore della vera media della popolazione sottostante. In questo caso, lerrore standard stimato sarà generalmente molto inferiore alla deviazione standard campionaria dei punti dati originali, poiché lo stimatore medio è meno variabile dei dati stessi.

Per vedere come funziona in modo più specifico , lascia che $ X_1, …, X_n \ sim \ text {IID Dist} $ siano i tuoi valori campione osservabili e che $ \ bar {X} = \ sum_ {i = 1} ^ n X_i / n $ sia il campione risultante media, che è considerato uno stimatore della popolazione sottostante significa $ \ mu = \ mathbb {E} (X_i) $. Se lasciamo che $ \ sigma ^ 2 = \ mathbb {V} (X_i) $ sia la varianza della popolazione sottostante, il vero errore standard della media campionaria è:

$$ \ begin {equation} \ begin {align} \ text {se} \ equiv \ text {se} (\ bar {X}) \ equiv \ mathbb {S} (\ bar {X}) & = \ sqrt {\ mathbb {V} (\ bar {X})} \\ [6pt] & = \ sqrt {\ mathbb {V} \ Big (\ frac {1} { n} \ sum_ {i = 1} ^ n X_i \ Big)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ { i = 1} ^ n \ mathbb {V} (X_i)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ {i = 1} ^ n \ sigma ^ 2} \\ [6pt] & = \ sqrt {\ frac {n \ sigma ^ 2} {n ^ 2}} \\ [6pt ] & = \ sqrt {\ frac {\ sigma ^ 2} {n}} \\ [6pt] & = \ frac { \ sigma ^ 2} {\ sqrt {n}}. \\ [6pt] \ end {align} \ end {equation} $$

Sostituendo il parametro sconosciuto $ \ sigma $ con la deviazione standard del campione osservabile $ s $ si ottiene il errore standard stimato :

$$ \ widehat {\ text {se}} = \ frac {s ^ 2} {\ sqrt {n}}. $$

Lerrore standard stimato è non una stima della dispersione di i dati sottostanti; è una stima della dispersione dello stimatore nel tuo problema, che in questo caso è la media campionaria. Poiché la media campionaria fa la media su tutti i valori osservati, è molto meno variabile di quei valori iniziali. In particolare, possiamo vedere dal risultato sopra che lerrore standard stimato della media è uguale alla deviazione standard campionaria dei dati sottostanti, diviso per $ \ sqrt {n} $. Ora, ovviamente allaumentare di $ n $, il SEM sarà sostanzialmente inferiore alla deviazione standard campionaria dei dati sottostanti.

Una volta calcolato il SEM stimato, è normale utilizzarlo per dare un intervallo di confidenza per la vera popolazione sottostante media $ \ mu $ a un livello di confidenza specificato $ 1- \ alpha $. Questa operazione può essere eseguita utilizzando la formula dellintervallo standard per una media della popolazione:

$$ \ text {CI} _ \ mu (1- \ alpha) = \ Big [\ bar {X} \ pm t_ { n-1, \ alpha / 2} \ cdot \ widehat {se} \ Big] = \ Big [\ bar {X} \ pm \ frac {t_ {n-1, \ alpha / 2}} {\ sqrt {n }} \ cdot s \ Big]. $$

Contrariamente allobiettivo dichiarato nella tua domanda, non è mai una buona idea riportare lintervallo $ \ bar {X} \ pm \ widehat {se} $; questo è solo un intervallo di confidenza che utilizza lo strano requisito che $ t_ {n-1, \ alpha / 2} = 1 $, il che potrebbe essere fuorviante per il tuo lettore. Invece, dovresti scegliere un livello di confidenza ragionevole $ 1- \ alpha $ e fornire un intervallo di confidenza adeguato, segnalando il tuo livello di confidenza al tuo lettore.


Applicazione ai tuoi dati: Dalla tua analisi risulta che stai cercando di aggregare i tuoi dati, ignorando le covariate del valore temporale e quindi analizzandole come un unico campione IID. Questo non è necessariamente il modo migliore per analizzare i dati, ma procederò in questo modo per utilizzare il tuo metodo, per concentrarmi sugli aspetti del SEM nella tua domanda. Su questa base, hai $ n = 30 $ e $ s = 0,7722 $ (che ho calcolato dai trenta valori nella tua tabella). Lerrore standard stimato della media dovrebbe quindi essere $ \ widehat {\ text {se}} = 0.7722 / \ sqrt {30} = 0.1410 $. Non mi è chiaro come hai ottenuto il valore contrario riportato nella tua domanda.

In ogni caso, puoi vedere che lerrore standard stimato $ \ widehat {\ text {se}} = 0,1410 $ è sostanzialmente inferiore alla deviazione standard campionaria $ s = 0,7722 $. Come notato sopra, ciò non sorprende, poiché la prima è la deviazione standard stimata di una media campionaria e la media campionaria è meno variabile a causa della media tra più punti dati. Prendendo $ \ alpha = 0.05 $ otteniamo $ t_ {n-1, \ alpha / 2} = t_ {29,0.025} = 2.0452 $, quindi lintervallo di confidenza $ 95 $% risultante per la media della popolazione reale è:

$$ \ text {CI} _ \ mu (0.95) = \ Big [7.7920 \ pm 2.0452 \ cdot 0.1410 \ Big] = \ Big [7.7920 \ pm 0.2884 \ Big] = \ Big [7.5038, 8.0804 \ Big]. $$

Come notato, questa analisi ignora i dati temporali e tratta semplicemente tutti i valori come un singolo campione IID, quindi è importante ricordare che questo intervallo di confidenza è subordinato al trattamento di i dati (che sembra essere quello che stai cercando). Questa non è la migliore forma di analisi; un approccio migliore sarebbe usare la covariata temporale in un modello di regressione.

Risposta

Nota che SEM non è lerrore di i campioni confrontati con la media, è la STD degli stimatori medi.

Per essere più chiari, la STD della distribuzione dovrebbe rimanere più o meno la stessa di un grande numero di campioni, ma lo stimatore medio in realtà converge e lerrore va a 0.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *