Voici ma requête.
Jai 6 participants, où les mesures de glucose sont prises à 30 minutes, 60 … jusquà 150 minutes. Par conséquent, jai au total 30 points de données.
Pour chaque plage horaire, jai calculé une lecture de glucose moyenne pour les 6 participants par exemple 1. moyenne des participants à 30 minutes est de 7,96, SD est de 0,92, SEM est de 0,38 2. moyenne des participants à 60 minutes est de 7,68, SD est de 0,93, SEM est de 0,38
Les autres valeurs SEM sont de 0,27 , 0,35, 0,25.
Maintenant, pour un calcul statistique, je dois calculer la moyenne ± SEM sur tous les points de données. La moyenne est facile – il suffit de faire la moyenne des 30. Mais pour le SEM, si jessaye pour le calculer via la méthode Excel normale, je me retrouve avec une valeur de 0,089 .. ce qui, lors du reporting, me donne 7,79 ± 0,08. Ce qui est évidemment trop petit pour cela car les valeurs vont de 6,69 à 9,17.
Y a-t-il un calcul qui me manque? Dois-je simplement additionner / calculer la moyenne de la SEM pour les points temporels?
Merci davance!
Jai réussi à télécharger une image de la table de données:
Commentaires
- Pourriez-vous clarifier exactement que devez-vous signaler? Comme @Cherny le suggère, la manière exacte dont vous faites cela dépend de la question exacte à laquelle vous devez répondre. Si vous nêtes pas sûr, veuillez fournir les conseils que vous avez ou la question à laquelle vous souhaitez répondre avec cette analyse
Réponse
L erreur type est lécart type dun estimateur ; le SEM survient donc lorsque vous utilisez la moyenne de léchantillon comme estimateur de la vraie moyenne sous-jacente de la population. Dans ce cas, lerreur standard estimée sera généralement beaucoup plus petite que lécart type de léchantillon des points de données dorigine, puisque lestimateur moyen est moins variable que les données elles-mêmes.
Pour voir comment cela fonctionne plus spécifiquement , soit $ X_1, …, X_n \ sim \ text {IID Dist} $ être vos valeurs déchantillons observables et soit $ \ bar {X} = \ sum_ {i = 1} ^ n X_i / n $ léchantillon résultant moyenne, qui est considérée comme un estimateur de la moyenne sous-jacente de la population $ \ mu = \ mathbb {E} (X_i) $. Si nous laissons $ \ sigma ^ 2 = \ mathbb {V} (X_i) $ la variance sous-jacente de la population, alors la vraie erreur standard de la moyenne de léchantillon est:
$$ \ begin {equation} \ begin {aligné} \ text {se} \ equiv \ text {se} (\ bar {X}) \ equiv \ mathbb {S} (\ bar {X}) & = \ sqrt {\ mathbb {V} (\ bar {X})} \\ [6pt] & = \ sqrt {\ mathbb {V} \ Big (\ frac {1} { n} \ sum_ {i = 1} ^ n X_i \ Big)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ { i = 1} ^ n \ mathbb {V} (X_i)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ {i = 1} ^ n \ sigma ^ 2} \\ [6pt] & = \ sqrt {\ frac {n \ sigma ^ 2} {n ^ 2}} \\ [6pt ] & = \ sqrt {\ frac {\ sigma ^ 2} {n}} \\ [6pt] & = \ frac { \ sigma ^ 2} {\ sqrt {n}}. \\ [6pt] \ end {aligné} \ end {équation} $$
En remplaçant le paramètre inconnu $ \ sigma $ par lécart type de léchantillon observable $ s $, on obtient le erreur standard estimée :
$$ \ widehat {\ text {se}} = \ frac {s ^ 2} {\ sqrt {n}}. $$
Lerreur type estimée est et non une estimation de la dispersion de les données sous-jacentes; il sagit dune estimation de la dispersion de l estimateur dans votre problème, qui est la moyenne de léchantillon dans ce cas. Puisque la moyenne de léchantillon fait la moyenne de toutes les valeurs observées, elle est beaucoup moins variable que ces valeurs initiales. Plus précisément, nous pouvons voir à partir du résultat ci-dessus que lerreur standard estimée de la moyenne est égale à lécart type de léchantillon des données sous-jacentes, divisé par $ \ sqrt {n} $. Maintenant, évidemment, à mesure que $ n $ grossit, le SEM sera nettement inférieur à lécart type de léchantillon des données sous-jacentes.
Une fois que vous avez calculé le SEM estimé, il est habituel de lutiliser pour donnez un intervalle de confiance pour la vraie population sous-jacente moyenne $ \ mu $ à un certain niveau de confiance spécifié $ 1- \ alpha $. Cela peut être fait en utilisant la formule dintervalle standard pour une moyenne de population:
$$ \ text {CI} _ \ mu (1- \ alpha) = \ Big [\ bar {X} \ pm t_ { n-1, \ alpha / 2} \ cdot \ widehat {se} \ Big] = \ Big [\ bar {X} \ pm \ frac {t_ {n-1, \ alpha / 2}} {\ sqrt {n }} \ cdot s \ Big]. $$
Contrairement à lobjectif énoncé dans votre question, ce nest jamais une bonne idée de signaler lintervalle $ \ bar {X} \ pm \ widehat {se} $; ceci est juste un intervalle de confiance utilisant létrange exigence que $ t_ {n-1, \ alpha / 2} = 1 $, ce qui est susceptible dinduire votre lecteur en erreur. Au lieu de cela, vous devez choisir un niveau de confiance raisonnable $ 1- \ alpha $, et donner un intervalle de confiance approprié, en rapportant votre niveau de confiance à votre lecteur.
Application à vos données: Il ressort de votre analyse que vous cherchez à agréger vos données, en ignorant les covariables de valeur de temps, et en les analysant donc comme un seul échantillon IID. Ce nest pas forcément la meilleure façon danalyser les données, mais je vais procéder de cette façon afin dutiliser votre méthode, pour me concentrer sur les aspects du SEM dans votre question. Sur cette base, vous avez $ n = 30 $ et $ s = 0.7722 $ (que jai calculé à partir des trente valeurs de votre tableau). Lerreur standard estimée de la moyenne devrait alors être $ \ widehat {\ text {se}} = 0,7722 / \ sqrt {30} = 0,1410 $. Je ne sais pas comment vous avez obtenu la valeur contraire dans votre question.
Dans tous les cas, vous pouvez voir que lerreur standard estimée $ \ widehat {\ text {se}} = 0,1410 $ est substantiellement inférieur à lécart type de léchantillon $ s = 0,7722 $. Comme indiqué ci-dessus, cela nest pas surprenant, puisque le premier est lécart-type estimé dune moyenne déchantillon, et que la moyenne de léchantillon est moins variable en raison de la moyenne entre plusieurs points de données. En prenant $ \ alpha = 0,05 $, nous obtenons $ t_ {n-1, \ alpha / 2} = t_ {29,0,025} = 2,0452 $, donc lintervalle de confiance résultant de 95 $% pour la vraie moyenne de la population est:
$$ \ text {CI} _ \ mu (0.95) = \ Big [7.7920 \ pm 2.0452 \ cdot 0.1410 \ Big] = \ Big [7.7920 \ pm 0.2884 \ Big] = \ Big [7.5038, 8.0804 \ Big]. $$
Comme indiqué, cette analyse ignore les données temporelles et traite simplement toutes les valeurs comme un seul échantillon IID, il est donc important de se rappeler que cet intervalle de confiance dépend de ce traitement de les données (ce qui semble être ce que vous recherchez). Ce nest pas la meilleure forme danalyse; une meilleure approche serait dutiliser la covariable temporelle dans un modèle de régression.
Réponse
Notez que SEM nest pas lerreur de les échantillons comparés à la moyenne, cest le STD des estimateurs moyens.
Pour être plus clair, le STD de la distribution devrait rester à peu près le même que vous passez au grand nombre déchantillons, mais lestimateur moyen en fait converge et son erreur passe à 0.