Hier is mijn vraag.

Ik heb er 6 deelnemers, waar glucosemetingen worden uitgevoerd op 30 minuten, 60 .. tot 150 minuten. Daarom heb ik in totaal 30 datapunten

Voor elk tijdvak heb ik een gemiddelde glucosemeting berekend voor alle 6 deelnemers bijv. 1. gemiddelde van deelnemers na 30 minuten is 7,96, SD is 0,92, SEM is 0,38 2. gemiddelde van deelnemers na 60 minuten is 7,68, SD is 0,93, SEM is 0,38

De andere SEM-waarden zijn 0,27 , 0,35, 0,25.

Nu moet ik voor een statistische berekening het gemiddelde ± SEM berekenen over alle gegevenspunten. Het gemiddelde is eenvoudig – gewoon alle 30 gemiddeld. Maar voor de SEM, als ik het probeer om het via de normale Excel-methode te berekenen, krijg ik een waarde van 0,089 .. wat bij rapportage 7,79 ± 0,08 oplevert. Dat is natuurlijk te klein omdat de waarden variëren van 6,69-9,17.

Is er een berekening die ik mis? Moet ik de SEM voor de tijdstippen optellen / middelen?

Bij voorbaat dank!

Het is gelukt om een afbeelding van de gegevenstabel te uploaden: Tabel met gegevens

Opmerkingen

  • Kunt u dit precies verduidelijken wat moet je melden? Zoals @Cherny suggereert, hangt de exacte manier waarop u dit doet af van de exacte vraag die u moet beantwoorden. Als u het niet zeker weet, geef dan de begeleiding die u heeft of welke vraag u met deze analyse wilt beantwoorden.

Antwoord

De standaardfout is de standaarddeviatie van een schatter ; de SEM ontstaat dus wanneer u het steekproefgemiddelde gebruikt als een schatter van het werkelijke onderliggende populatiegemiddelde. In dit geval zal de geschatte standaardfout over het algemeen veel kleiner zijn dan de standaarddeviatie van de steekproef van de oorspronkelijke gegevenspunten, aangezien de gemiddelde schatter minder variabel is dan de gegevens zelf.

Om te zien hoe dit specifieker werkt , laat $ X_1, …, X_n \ sim \ text {IID Dist} $ uw waarneembare voorbeeldwaarden zijn en laat $ \ bar {X} = \ sum_ {i = 1} ^ n X_i / n $ het resulterende voorbeeld zijn gemiddelde, dat wordt beschouwd als een schatter van het onderliggende populatiegemiddelde $ \ mu = \ mathbb {E} (X_i) $. Als we $ \ sigma ^ 2 = \ mathbb {V} (X_i) $ de onderliggende populatievariantie laten zijn, dan is de echte standaardfout van het steekproefgemiddelde:

$$ \ begin {equation} \ begin {uitgelijnd} \ text {se} \ equiv \ text {se} (\ balk {X}) \ equiv \ mathbb {S} (\ balk {X}) & = \ sqrt {\ mathbb {V} (\ bar {X})} \\ [6pt] & = \ sqrt {\ mathbb {V} \ Big (\ frac {1} { n} \ sum_ {i = 1} ^ n X_i \ Big)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ { i = 1} ^ n \ mathbb {V} (X_i)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ {i = 1} ^ n \ sigma ^ 2} \\ [6pt] & = \ sqrt {\ frac {n \ sigma ^ 2} {n ^ 2}} \\ [6pt ] & = \ sqrt {\ frac {\ sigma ^ 2} {n}} \\ [6pt] & = \ frac { \ sigma ^ 2} {\ sqrt {n}}. \\ [6pt] \ end {uitgelijnd} \ end {equation} $$

Het vervangen van de onbekende parameter $ \ sigma $ door de waarneembare standaarddeviatie $ s $ geeft de geschatte standaardfout :

$$ \ widehat {\ text {se}} = \ frac {s ^ 2} {\ sqrt {n}}. $$

De geschatte standaardfout is niet een schatting van de spreiding van de onderliggende data; het is een schatting van de spreiding van de schatter in uw probleem, wat in dit geval het steekproefgemiddelde is. Omdat het gemiddelde van de steekproef over alle waargenomen waarden gemiddeld is, is het veel minder variabel dan die initiële waarden. Concreet kunnen we uit het bovenstaande resultaat zien dat de geschatte standaardfout van het gemiddelde gelijk is aan de standaarddeviatie van de steekproef van de onderliggende gegevens, gedeeld door $ \ sqrt {n} $. Nu, naarmate $ n $ groter wordt, zal de SEM duidelijk aanzienlijk kleiner zijn dan de standaarddeviatie van de steekproef van de onderliggende gegevens.

Zodra u de geschatte SEM hebt berekend, is het gebruikelijk om deze te gebruiken om geef een betrouwbaarheidsinterval voor het werkelijke onderliggende populatiegemiddelde $ \ mu $ op een bepaald betrouwbaarheidsniveau $ 1- \ alpha $. Dit kan worden gedaan met behulp van de standaard intervalformule voor een populatiegemiddelde:

$$ \ text {CI} _ \ mu (1- \ alpha) = \ Big [\ bar {X} \ pm t_ { n-1, \ alpha / 2} \ cdot \ widehat {se} \ Big] = \ Big [\ bar {X} \ pm \ frac {t_ {n-1, \ alpha / 2}} {\ sqrt {n }} \ cdot s \ Big]. $$

In tegenstelling tot het doel dat in je vraag is vermeld, is het nooit een goed idee om het interval te rapporteren $ \ bar {X} \ pm \ widehat {se} $; dit is slechts een betrouwbaarheidsinterval met behulp van de vreemde vereiste dat $ t_ {n-1, \ alpha / 2} = 1 $, wat waarschijnlijk misleidend is voor uw lezer. In plaats daarvan moet u een redelijk betrouwbaarheidsniveau $ 1- \ alpha $ kiezen en een juist betrouwbaarheidsinterval geven, waarbij u uw vertrouwensniveau aan uw lezer rapporteert.


Toepassing op uw gegevens: Uit uw analyse blijkt dat u probeert te aggregeren uw gegevens, waarbij de covariaten van de tijdwaarde worden genegeerd en daarom worden geanalyseerd als een enkele IID-steekproef. Dit is niet noodzakelijk de beste manier om de gegevens te analyseren, maar ik zal op deze manier te werk gaan om uw methode te gebruiken, om me te concentreren op de aspecten van de SEM in uw vraag. Op deze basis heb je $ n = 30 $ en $ s = 0,7722 $ (die ik heb berekend op basis van de dertig waarden in je tabel). De geschatte standaardfout van het gemiddelde moet dan $ \ widehat {\ text {se}} = 0.7722 / \ sqrt {30} = 0.1410 $ zijn. Het is mij onduidelijk hoe u de tegenovergestelde waarde in uw vraag hebt gerapporteerd.

In ieder geval kunt u zien dat de geschatte standaardfout $ \ widehat {\ text {se}} = 0.1410 $ substantieel is lager dan de standaarddeviatie van de steekproef $ s = 0,7722 $. Zoals hierboven opgemerkt, is dit niet verrassend, aangezien de eerste de geschatte standaarddeviatie van een steekproefgemiddelde is en het steekproefgemiddelde minder variabel is vanwege middeling over meerdere gegevenspunten. Als we $ \ alpha = 0.05 $ nemen, krijgen we $ t_ {n-1, \ alpha / 2} = t_ {29,0.025} = 2.0452 $, dus het resulterende betrouwbaarheidsinterval van $ 95 $% voor het werkelijke populatiegemiddelde is:

$$ \ text {CI} _ \ mu (0.95) = \ Big [7.7920 \ pm 2.0452 \ cdot 0.1410 \ Big] = \ Big [7.7920 \ pm 0.2884 \ Big] = \ Big [7.5038, 8.0804 \ Big]. $$

Zoals opgemerkt negeert deze analyse de tijdgegevens en behandelt alle waarden eenvoudig als een enkele IID-steekproef, dus het is belangrijk om te onthouden dat dit betrouwbaarheidsinterval afhankelijk is van de behandeling van de gegevens (wat lijkt te zijn wat u zoekt). Dit is niet de beste vorm van analyse; een betere benadering zou zijn om de tijdcovariabele in een regressiemodel te gebruiken.

Antwoord

Merk op dat SEM niet de fout is van de steekproeven vergeleken met het gemiddelde, het is de STD van de gemiddelde schatters.

Voor de duidelijkheid: de STD van de verdeling zou ongeveer hetzelfde moeten blijven als je naar het aantal grote steekproeven gaat, maar de gemiddelde schatter eigenlijk convergeert en de fout gaat naar 0.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *