Här är min fråga.

Jag har 6 deltagare, där glukosavläsningarna tas 30 minuter, 60 .. upp till 150 minuter. Därför har jag totalt 30 datapunkter

För varje tidslucka har jag beräknat en genomsnittlig glukosavläsning för alla 6 deltagarna t.ex. 1. genomsnitt av deltagare vid 30 minuter är 7,96, SD är 0,92, SEM är 0,38 2. genomsnitt av deltagare vid 60 minuter är 7,68, SD är 0,93, SEM är 0,38

De andra SEM-värdena är 0,27 , 0,35, 0,25.

Nu, för en statistisk beräkning, måste jag beräkna medelvärdet ± SEM över alla datapunkter .. Genomsnittet är enkelt – bara genomsnittet alla 30. Men för SEM, om jag försöker för att beräkna det via den normala excel-metoden slutar jag med ett värde på 0,089 .. vilket vid rapportering ger mig 7,79 ± 0,08, vilket uppenbarligen är för litet för detta eftersom värdena sträcker sig från 6.69-9.17. Finns det en beräkning som jag saknar? Ska jag bara summera / beräkna SEM för tidpunkterna?

Tack på förhand!

Klarade att ladda upp en bild av datatabellen: Datatabell

Kommentarer

  • Kan du klargöra exakt vad du behöver rapportera? Som @Cherny föreslår exakt hur du gör detta beror på den exakta frågan du behöver svara på. Om du är osäker, vänligen ge den vägledning du har eller vilken fråga du vill ta itu med den här analysen

Svar

standardfel är standardavvikelsen för en uppskattare ; SEM uppstår därför när du använder provmedlet som en uppskattning av det verkliga underliggande populationsmedlet. I det här fallet kommer det uppskattade standardfelet i allmänhet att vara mycket mindre än standardavvikelsen för de ursprungliga datapunkterna, eftersom medeluppskattaren är mindre variabel än själva data.

För att se hur detta fungerar mer specifikt , låt $ X_1, …, X_n \ sim \ text {IID Dist} $ vara dina observerbara exempelvärden och låt $ \ bar {X} = \ sum_ {i = 1} ^ n X_i / n $ vara det resulterande exemplet medelvärdet, som anses vara en uppskattning av den underliggande populationens medelvärde $ \ mu = \ mathbb {E} (X_i) $. Om vi låter $ \ sigma ^ 2 = \ mathbb {V} (X_i) $ vara den underliggande populationsvariansen, är det verkliga standardfelet för provmedlet:

$$ \ begin {ekvation} \ begin {align} \ text {se} \ equiv \ text {se} (\ bar {X}) \ equiv \ mathbb {S} (\ bar {X}) & = \ sqrt {\ mathbb {V} (\ bar {X})} \\ [6pt] & = \ sqrt {\ mathbb {V} \ Big (\ frac {1} { n} \ sum_ {i = 1} ^ n X_i \ Big)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ { i = 1} ^ n \ mathbb {V} (X_i)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ {i = 1} ^ n \ sigma ^ 2} \\ [6pt] & = \ sqrt {\ frac {n \ sigma ^ 2} {n ^ 2}} \\ [6pt ] & = \ sqrt {\ frac {\ sigma ^ 2} {n}} \\ [6pt] & = \ frac { \ sigma ^ 2} {\ sqrt {n}}. \\ [6pt] \ end {align} \ end {ekvation} $$

Om du byter ut den okända paretern $ \ sigma $ med den observerbara provstandardavvikelsen $ s $ ger uppskattat standardfel :

$$ \ widehat {\ text {se}} = \ frac {s ^ 2} {\ sqrt {n}}. $$

Det uppskattade standardfelet är inte en uppskattning av spridningen av underliggande data; det är en uppskattning av spridningen av uppskattaren i ditt problem, vilket är det genomsnittliga exemplet i detta fall. Eftersom medelvärdet av provet är genomsnittligt över alla observerade värden är det mycket mindre variabelt än de initiala värdena. Specifikt kan vi se från ovanstående resultat att det uppskattade standardfelet för medelvärdet är lika med standardavvikelsen för den underliggande data dividerat med $ \ sqrt {n} $. Nu, uppenbarligen när $ n $ blir större, kommer SEM att bli väsentligt mindre än standardavvikelsen för de underliggande uppgifterna.

När du har beräknat den beräknade SEM är det vanligt att använda detta för att ge ett konfidensintervall för den verkliga underliggande befolkningen betyder $ \ mu $ vid någon specificerad konfidensnivå $ 1- \ alpha $. Detta kan göras med hjälp av standardintervallformeln för ett populationsmedelvärde:

$$ \ text {CI} _ \ mu (1- \ alpha) = \ Big [\ bar {X} \ pm t_ { n-1, \ alpha / 2} \ cdot \ widehat {se} \ Big] = \ Big [\ bar {X} \ pm \ frac {t_ {n-1, \ alpha / 2}} {\ sqrt {n }} \ cdot s \ Big]. $$

I motsats till det mål som anges i din fråga, det är aldrig en bra idé att rapportera intervallet $ \ bar {X} \ pm \ widehat {se} $; detta är bara ett konfidensintervall med det konstiga kravet att $ t_ {n-1, \ alpha / 2} = 1 $, vilket sannolikt kan vara vilseledande för din läsare. Istället bör du välja en förnuftig konfidensnivå $ 1- \ alpha $ och ge ett korrekt konfidensintervall och rapportera din konfidensnivå till din läsare.


Tillämpning på dina data: Det framgår av din analys att du försöker samla dina data, ignorerar tidsvärdets kovariater och analyserar dem därför som ett enda IID-prov. Detta är inte nödvändigtvis det bästa sättet att analysera data, men jag kommer att fortsätta på detta sätt för att använda din metod, för att fokusera på aspekterna av SEM i din fråga. På grundval av detta har du $ n = 30 $ och $ s = 0.7722 $ (som jag beräknade utifrån de trettio värdena i din tabell). Det uppskattade standardfelet för medelvärdet ska då vara $ \ widehat {\ text {se}} = 0,7722 / \ sqrt {30} = 0,1410 $. Det är oklart för mig hur du fick det motsatta värdet rapporterat i din fråga.

I vilket fall som helst kan du se att det uppskattade standardfelet $ \ widehat {\ text {se}} = 0,1410 $ är väsentligen lägre än standardavvikelsen $ s = 0,7722 $. Som nämnts ovan är detta inte förvånande, eftersom den förra är den uppskattade standardavvikelsen för ett provmedelvärde, och provets medelvärde är mindre variabelt på grund av genomsnittet över flera datapunkter. Om vi tar $ \ alpha = 0,05 $ får vi $ t_ {n-1, \ alpha / 2} = t_ {29,0.025} = 2,0452 $, så det resulterande $ 95 $% konfidensintervallet för det sanna populationsmedlet är:

$$ \ text {CI} _ \ mu (0.95) = \ Big [7.7920 \ pm 2.0452 \ cdot 0.1410 \ Big] = \ Big [7.7920 \ pm 0.2884 \ Big] = \ Big [7.5038, 8.0804 \ Big]. $$

Som nämnts ignorerar denna analys tidsdata och behandlar helt enkelt alla värden som ett enda IID-prov, så det är viktigt att komma ihåg att detta konfidensintervall är beroende av den behandlingen av data (som verkar vara vad du är ute efter). Detta är inte den bästa analysformen; ett bättre tillvägagångssätt skulle vara att använda tidskovariat i en regressionsmodell.

Svar

Observera att SEM inte är felet i proverna jämfört med genomsnittet är det STD för medeluppskattarna.

För att vara tydligare bör fördelningen STD förbli ungefär densamma när du går till stort antal prover, men medeluppskattaren faktiskt konvergerar och felet går till 0.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *