Hier ist meine Abfrage.

Ich habe 6 Teilnehmer, bei denen die Glukosewerte nach 30 Minuten, 60 bis 150 Minuten gemessen werden. Daher habe ich insgesamt 30 Datenpunkte.

Für jedes Zeitfenster habe ich einen durchschnittlichen Glukosewert für alle 6 Teilnehmer berechnet zB 1. Durchschnitt der Teilnehmer nach 30 Minuten ist 7,96, SD ist 0,92, SEM ist 0,38 2. Durchschnitt der Teilnehmer nach 60 Minuten ist 7,68, SD ist 0,93, SEM ist 0,38

Die anderen SEM-Werte sind 0,27 , 0,35, 0,25.

Für eine statistische Berechnung muss ich nun den Durchschnitt ± SEM über alle Datenpunkte berechnen. Der Durchschnitt ist einfach – nur der Durchschnitt aller 30. Aber für das SEM, wenn ich es versuche Um es mit der normalen Excel-Methode zu berechnen, erhalte ich einen Wert von 0,089. Dies ergibt bei der Berichterstattung 7,79 ± 0,08. Dies ist offensichtlich zu klein, da die Werte zwischen 6,69 und 9,17 liegen.

Gibt es eine Berechnung, die mir fehlt? Sollte ich nur das SEM für die Zeitpunkte summieren / mitteln?

Vielen Dank im Voraus!

Es ist gelungen, ein Bild der Datentabelle hochzuladen: Datentabelle

Kommentare

  • Können Sie das genau erläutern? Was müssen Sie melden? Wie @Cherny vorschlägt, hängt die genaue Vorgehensweise von der genauen Frage ab, die Sie beantworten müssen. Wenn Sie sich nicht sicher sind, geben Sie bitte an, welche Anleitung Sie haben oder welche Frage Sie mit dieser Analyse beantworten möchten.

Antwort

Der Standardfehler ist die Standardabweichung eines Schätzers ; Das SEM entsteht daher, wenn Sie den Stichprobenmittelwert als Schätzer für den tatsächlichen zugrunde liegenden Populationsmittelwert verwenden. In diesem Fall ist der geschätzte Standardfehler im Allgemeinen viel kleiner als die Standardabweichung der Stichprobe der ursprünglichen Datenpunkte, da der mittlere Schätzer weniger variabel ist als die Daten selbst.

Um zu sehen, wie dies genauer funktioniert , sei $ X_1, …, X_n \ sim \ text {IID Dist} $ deine beobachtbaren Stichprobenwerte und sei $ \ bar {X} = \ sum_ {i = 1} ^ n X_i / n $ die resultierende Stichprobe Mittelwert, der als Schätzer des zugrunde liegenden Populationsmittelwerts $ \ mu = \ mathbb {E} (X_i) $ angesehen wird. Wenn wir $ \ sigma ^ 2 = \ mathbb {V} (X_i) $ die zugrunde liegende Populationsvarianz sein lassen, ist der wahre Standardfehler des Stichprobenmittelwerts:

$$ \ begin {Gleichung} \ begin {ausgerichtet} \ text {se} \ äquiv \ text {se} (\ bar {X}) \ äquiv \ mathbb {S} (\ bar {X}) & = \ sqrt {\ mathbb {V} (\ bar {X})} \\ [6pt] & = \ sqrt {\ mathbb {V} \ Big (\ frac {1} { n} \ sum_ {i = 1} ^ n X_i \ Big)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ { i = 1} ^ n \ mathbb {V} (X_i)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ {i = 1} ^ n \ sigma ^ 2} \\ [6pt] & = \ sqrt {\ frac {n \ sigma ^ 2} {n ^ 2}} \\ [6pt ] & = \ sqrt {\ frac {\ sigma ^ 2} {n}} \\ [6pt] & = \ frac { \ sigma ^ 2} {\ sqrt {n}}. \\ [6pt] \ end {align} \ end {Gleichung} $$

Wenn Sie den unbekannten Parameter $ \ sigma $ durch die beobachtbare Standardabweichung der Stichprobe $ s $ ersetzen, erhalten Sie die geschätzter Standardfehler :

$$ \ widehat {\ text {se}} = \ frac {s ^ 2} {\ sqrt {n}}. $$

Der geschätzte Standardfehler ist nicht eine Schätzung der Streuung von die zugrunde liegenden Daten; Dies ist eine Schätzung der Streuung des Schätzers in Ihrem Problem, die in diesem Fall der Stichprobenmittelwert ist. Da der Mittelwert der Stichprobe über alle beobachteten Werte gemittelt wird, ist er viel weniger variabel als diese Anfangswerte. Insbesondere können wir aus dem obigen Ergebnis sehen, dass der geschätzte Standardfehler des Mittelwerts gleich der Standardabweichung der Stichprobe der zugrunde liegenden Daten ist, geteilt durch $ \ sqrt {n} $. Wenn $ n $ größer wird, ist das SEM offensichtlich wesentlich kleiner als die Standardabweichung der Stichprobe der zugrunde liegenden Daten.

Sobald Sie das geschätzte SEM berechnet haben, ist es üblich, dies zu verwenden Geben Sie ein -Konfidenzintervall für den wahren zugrunde liegenden Populationsmittelwert $ \ mu $ bei einem bestimmten Konfidenzniveau $ 1- \ alpha $ an. Dies kann unter Verwendung der Standardintervallformel für einen Populationsmittelwert erfolgen:

$$ \ text {CI} _ \ mu (1- \ alpha) = \ Big [\ bar {X} \ pm t_ { n-1, \ alpha / 2} \ cdot \ widehat {se} \ Big] = \ Big [\ bar {X} \ pm \ frac {t_ {n-1, \ alpha / 2}} {\ sqrt {n }} \ cdot s \ Big]. $$

Im Gegensatz zu dem in Ihrer Frage angegebenen Ziel ist es niemals eine gute Idee, das Intervall $ \ bar {X} anzugeben. \ pm \ widehat {se} $; Dies ist nur ein Konfidenzintervall unter Verwendung der seltsamen Anforderung, dass $ t_ {n-1, \ alpha / 2} = 1 $, was für Ihren Leser wahrscheinlich irreführend ist. Stattdessen sollten Sie ein vernünftiges Konfidenzniveau $ 1- \ alpha $ wählen und ein angemessenes Konfidenzintervall angeben, um Ihr Konfidenzniveau Ihrem Leser zu melden.


Anwendung auf Ihre Daten: Aus Ihrer Analyse geht hervor, dass Sie aggregieren möchten Ihre Daten, ignorieren die Zeitwertkovariaten und analysieren sie daher als einzelne IID-Stichprobe. Dies ist nicht unbedingt der beste Weg, um die Daten zu analysieren, aber ich werde auf diese Weise vorgehen, um Ihre Methode zu verwenden und mich auf die Aspekte des SEM in Ihrer Frage zu konzentrieren. Auf dieser Basis haben Sie $ n = 30 $ und $ s = 0,7722 $ (die ich aus den dreißig Werten in Ihrer Tabelle berechnet habe). Der geschätzte Standardfehler des Mittelwerts sollte dann $ \ widehat {\ text {se}} = 0,7722 / \ sqrt {30} = 0,1410 $ sein. Mir ist unklar, wie Sie den gegenteiligen Wert in Ihrer Frage angegeben haben.

In jedem Fall können Sie sehen, dass der geschätzte Standardfehler $ \ widehat {\ text {se}} = 0,1410 $ erheblich ist niedriger als die Standardabweichung der Stichprobe $ s = 0,7722 $. Wie oben erwähnt, ist dies nicht überraschend, da erstere die geschätzte Standardabweichung eines Stichprobenmittelwerts ist und der Stichprobenmittelwert aufgrund der Mittelung über mehrere Datenpunkte weniger variabel ist. Wenn wir $ \ alpha = 0,05 $ nehmen, erhalten wir $ t_ {n-1, \ alpha / 2} = t_ {29,0,025} = 2,0452 $. Das resultierende Konfidenzintervall von 95 $% für den wahren Populationsmittelwert lautet also:

$$ \ text {CI} _ \ mu (0,95) = \ Big [7,7920 \ pm 2,0452 \ cdot 0,1410 \ Big] = \ Big [7,7920 \ pm 0,2884 \ Big] = \ Big [7,5038, 8,0804 \ Big]. $$

Wie bereits erwähnt, ignoriert diese Analyse die Zeitdaten und behandelt einfach alle Werte als eine einzige IID-Stichprobe. Daher ist es wichtig, sich daran zu erinnern, dass dieses Konfidenzintervall von dieser Behandlung von abhängt die Daten (die scheinen, was Sie suchen). Dies ist nicht die beste Form der Analyse. Ein besserer Ansatz wäre die Verwendung der Zeitkovariate in einem Regressionsmodell.

Antwort

Beachten Sie, dass SEM nicht der Fehler von ist Bei den Stichproben im Vergleich zum Durchschnitt handelt es sich um die STD der mittleren Schätzer.

Um klarer zu sein, sollte die STD der Verteilung ungefähr gleich bleiben, wenn Sie zu einer großen Anzahl von Stichproben gehen, aber tatsächlich der mittlere Schätzer konvergiert und der Fehler geht auf 0.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.