Her er spørsmålet mitt.

Jeg har 6 deltakere, der glukoseavlesning blir tatt 30 minutter, 60 .. opp til 150 minutter. Derfor har jeg totalt 30 datapunkter

For hver tidsluke har jeg beregnet en gjennomsnittlig glukoseavlesning for alle 6 deltakerne f.eks. 1. gjennomsnitt av deltakere på 30 minutter er 7,96, SD er 0,92, SEM er 0,38. 2. gjennomsnitt av deltakere på 60 minutter er 7,68, SD er 0,93, SEM er 0,38

De andre SEM-verdiene er 0,27 , 0,35, 0,25.

Nå, for en statistisk beregning, må jeg beregne gjennomsnittet ± SEM over alle datapunkter .. Gjennomsnittet er enkelt – bare gjennomsnittet alle 30. Men for SEM, hvis jeg prøver for å beregne det via den normale excel-metoden, ender jeg opp med en verdi på 0,089 .. som ved rapportering gir meg 7,79 ± 0,08. Som åpenbart er for liten til dette da verdiene varierer fra 6,69-9,17.

Er det en beregning som jeg mangler? Skal jeg bare oppsummere / beregne SEM for tidspunkter?

Takk på forhånd!

Klarte å laste opp et bilde av datatabellen: Datatabell

Kommentarer

  • Kan du avklare nøyaktig hva du trenger å rapportere? Som @Cherny antyder den nøyaktige måten du gjør dette på, avhenger av nøyaktig spørsmålet du trenger å svare på. Hvis du ikke er sikker, vennligst oppgi hvilken veiledning du har eller hvilket spørsmål du søker å ta opp med denne analysen

Svar

standardfeil er standardavviket til en estimator ; SEM oppstår derfor når du bruker eksemplets gjennomsnitt som en estimator av det sanne underliggende populasjonsgjennomsnittet. I dette tilfellet vil den estimerte standardfeilen generelt være mye mindre enn standardavviket til de opprinnelige datapunktene, siden gjennomsnittsestimatoren er mindre variabel enn selve dataene.

For å se hvordan dette fungerer mer spesifikt , la $ X_1, …, X_n \ sim \ text {IID Dist} $ være dine observerbare eksempelverdier og la $ \ bar {X} = \ sum_ {i = 1} ^ n X_i / n $ være den resulterende prøven gjennomsnitt, som er ansett for å være en estimator av den underliggende populasjonen betyr $ \ mu = \ mathbb {E} (X_i) $. Hvis vi lar $ \ sigma ^ 2 = \ mathbb {V} (X_i) $ være den underliggende populasjonsvariansen, er den virkelige standardfeilen i eksemplets middelverdi:

$$ \ begin {ligning} \ begin {align} \ text {se} \ equiv \ text {se} (\ bar {X}) \ equiv \ mathbb {S} (\ bar {X}) & = \ sqrt {\ mathbb {V} (\ bar {X})} \\ [6pt] & = \ sqrt {\ mathbb {V} \ Big (\ frac {1} { n} \ sum_ {i = 1} ^ n X_i \ Big)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ { i = 1} ^ n \ mathbb {V} (X_i)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ {i = 1} ^ n \ sigma ^ 2} \\ [6pt] & = \ sqrt {\ frac {n \ sigma ^ 2} {n ^ 2}} \\ [6pt ] & = \ sqrt {\ frac {\ sigma ^ 2} {n}} \\ [6pt] & = \ frac { \ sigma ^ 2} {\ sqrt {n}}. \\ [6pt] \ end {align} \ end {equation} $$

Ved å erstatte den ukjente paraeter $ \ sigma $ med det observerbare prøven standardavvik $ s $ gir estimert standardfeil :

$$ \ widehat {\ text {se}} = \ frac {s ^ 2} {\ sqrt {n}}. $$

Den estimerte standardfeilen er ikke et estimat for spredningen av de underliggende dataene; det er et estimat av spredningen av estimatoren i problemet ditt, som er gjennomsnittet av prøven i dette tilfellet. Siden gjennomsnittet av prøven er gjennomsnittlig over alle de observerte verdiene, er den mye mindre variabel enn de opprinnelige verdiene. Spesifikt kan vi se fra det ovennevnte resultatet at den estimerte standardfeilen til gjennomsnittet er lik prøvenes standardavvik for de underliggende dataene, delt på $ \ sqrt {n} $. Nå, tydeligvis når $ n $ blir større, kommer SEM til å være vesentlig mindre enn standardavviket til de underliggende dataene.

Når du har beregnet estimert SEM, er det vanlig å bruke dette til gi et konfidensintervall for den sanne underliggende populasjonen betyr $ \ mu $ på et spesifisert konfidensnivå $ 1- \ alpha $. Dette kan gjøres ved å bruke standardintervallformelen for et populasjonsmiddel:

$$ \ text {CI} _ \ mu (1- \ alpha) = \ Big [\ bar {X} \ pm t_ { n-1, \ alpha / 2} \ cdot \ widehat {se} \ Big] = \ Big [\ bar {X} \ pm \ frac {t_ {n-1, \ alpha / 2}} {\ sqrt {n }} \ cdot s \ Big]. $$

I motsetning til målet som er oppgitt i spørsmålet ditt, er det aldri lurt å rapportere intervallet $ \ bar {X} \ pm \ widehat {se} $; dette er bare et konfidensintervall som bruker det merkelige kravet om at $ t_ {n-1, \ alpha / 2} = 1 $, som sannsynligvis vil være misvisende for leseren din. I stedet bør du velge et fornuftig konfidensnivå $ 1- \ alpha $, og gi et riktig konfidensintervall, og rapportere konfidensnivået til leseren din.


Søknad til dataene dine: Det fremgår av analysen din at du søker å samle dataene dine, ignorerer tidsverdien, og analyserer dem derfor som en enkelt IID-prøve. Dette er ikke nødvendigvis den beste måten å analysere dataene på, men jeg vil fortsette på denne måten for å bruke metoden din, for å fokusere på aspektene ved SEM i spørsmålet ditt. På dette grunnlaget har du $ n = 30 $ og $ s = 0.7722 $ (som jeg beregnet ut fra de tretti verdiene i tabellen din). Den estimerte standardfeilen for gjennomsnittet bør da være $ \ widehat {\ text {se}} = 0.7722 / \ sqrt {30} = 0.1410 $. Det er uklart for meg hvordan du mottok den motsatte verdien i spørsmålet ditt.

I alle fall kan du se at den estimerte standardfeilen $ \ widehat {\ text {se}} = 0,1410 $ er vesentlig lavere enn prøven standardavvik $ s = 0.7722 $. Som nevnt ovenfor er dette ikke overraskende, siden førstnevnte er det estimerte standardavviket til et gjennomsnitt av prøven, og prøvenes gjennomsnitt er mindre variabel på grunn av gjennomsnittet over flere datapunkter. Tar vi $ \ alpha = 0,05 $, får vi $ t_ {n-1, \ alpha / 2} = t_ {29,0.025} = 2,0452 $, så det resulterende $ 95 $% konfidensintervallet for det sanne populasjonsgjennomsnittet er:

$$ \ text {CI} _ \ mu (0.95) = \ Big [7.7920 \ pm 2.0452 \ cdot 0.1410 \ Big] = \ Big [7.7920 \ pm 0.2884 \ Big] = \ Big [7.5038, 8.0804 \ Big]. $$

Som nevnt ignorerer denne analysen tidsdataene og behandler ganske enkelt alle verdiene som en enkelt IID-prøve, så det er viktig å huske at dette konfidensintervallet er betinget av den behandlingen av dataene (som ser ut til å være det du er ute etter). Dette er ikke den beste formen for analyse; en bedre tilnærming ville være å bruke tidskovariasjonen i en regresjonsmodell.

Svar

Merk at SEM ikke er feilen til prøvene sammenlignet med gjennomsnittet, er det STD for gjennomsnittestimatorene.

For å være klarere, skal STD for fordelingen forbli omtrent den samme som du går til stort utvalgstall, men gjennomsnittestimatoren faktisk konvergerer og feilen går til 0.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *