Iată întrebarea mea.
Am 6 participanți, unde citirile de glucoză sunt luate la 30 de minute, 60 .. până la 150 de minute. Prin urmare, am 30 de puncte de date în total
Pentru fiecare interval de timp am calculat o citire medie a glucozei pentru toți cei 6 participanți de ex. 1. media participanților la 30 de minute este 7.96, SD este 0.92, SEM este 0.38 2. media participanților la 60 minute este 7.68, SD este 0.93, SEM este 0.38
Celelalte valori SEM sunt 0.27 , 0,35, 0,25.
Acum, pentru un calcul statistic, trebuie să calculez media ± SEM pentru toate punctele de date .. Media este ușoară – doar media tuturor 30. Dar pentru SEM, dacă încerc pentru a o calcula prin metoda excel normală, ajung cu o valoare de 0,089 .. ceea ce la raportare îmi dă 7,79 ± 0,08. Ceea ce este evident prea mic pentru asta, deoarece valorile variază de la 6,69-9,17.
Există un calcul care îmi lipsește? Ar trebui să însumez / să calculez SEM pentru punctele de timp?
Vă mulțumim anticipat!
Am reușit să încărcați o imagine a tabelului de date:
Comentarii
- Ați putea clarifica cu exactitate ce trebuie să raportezi? După cum sugerează @Cherny, modul exact în care faci acest lucru depinde de întrebarea exactă la care trebuie să răspunzi. Dacă nu sunteți sigur, vă rugăm să furnizați orice îndrumare aveți sau ce întrebare doriți să abordați cu această analiză
Răspuns
eroare standard este abaterea standard a unui estimator ; prin urmare, SEM apare atunci când utilizați media eșantionului ca un estimator al mediei reale a populației subiacente. În acest caz, eroarea standard estimată va fi în general mult mai mică decât deviația standard eșantion a punctelor de date originale, deoarece estimatorul mediu este mai puțin variabil decât datele în sine.
Pentru a vedea cum funcționează mai specific , să fie $ X_1, …, X_n \ sim \ text {IID Dist} $ să fie valorile dvs. probe observabile și să fie $ \ bar {X} = \ sum_ {i = 1} ^ n X_i / n $ să fie proba rezultată medie, care este considerată a fi un estimator al populației subiacente medie $ \ mu = \ mathbb {E} (X_i) $. Dacă lăsăm $ \ sigma ^ 2 = \ mathbb {V} (X_i) $ să fie varianța subiacentă a populației, atunci adevărata eroare standard a eșantionului mediu este:
$$ \ begin {ecuație} \ begin {align} \ text {se} \ equiv \ text {se} (\ bar {X}) \ equiv \ mathbb {S} (\ bar {X}) & = \ sqrt {\ mathbb {V} (\ bar {X})} \\ [6pt] & = \ sqrt {\ mathbb {V} \ Big (\ frac {1} { n} \ sum_ {i = 1} ^ n X_i \ Big)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ { i = 1} ^ n \ mathbb {V} (X_i)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ {i = 1} ^ n \ sigma ^ 2} \\ [6pt] & = \ sqrt {\ frac {n \ sigma ^ 2} {n ^ 2}} \\ [6pt ] & = \ sqrt {\ frac {\ sigma ^ 2} {n}} \\ [6pt] & = \ frac { \ sigma ^ 2} {\ sqrt {n}}. \\ [6pt] \ end {align} \ end {ecuație} $$
Înlocuirea parametrului necunoscut $ \ sigma $ cu deviația standard eșantionabilă observabilă $ s $ produce eroare standard estimată :
$$ \ widehat {\ text {se}} = \ frac {s ^ 2} {\ sqrt {n}}. $$
Eroarea standard estimată este nu o estimare a dispersiei datele de bază; este o estimare a dispersiei estimatorului în problema dvs., care este media eșantionului în acest caz. Deoarece media eșantionului medie asupra tuturor valorilor observate, este mult mai puțin variabilă decât acele valori inițiale. Mai exact, putem vedea din rezultatul de mai sus că eroarea standard estimată a mediei este egală cu eșantionul deviației standard a datelor de bază, împărțit la $ \ sqrt {n} $. Acum, evident, pe măsură ce $ n $ devine mai mare, SEM va fi substanțial mai mic decât eșantionul deviației standard a datelor de bază.
Odată ce ați calculat SEM estimat, este obișnuit să utilizați acest lucru pentru acordați un interval de încredere pentru adevărata populație subiacentă medie $ \ mu $ la un anumit nivel de încredere $ 1- \ alpha $. Acest lucru se poate face folosind formula standard a intervalului pentru o medie a populației:
$$ \ text {CI} _ \ mu (1- \ alpha) = \ Big [\ bar {X} \ pm t_ { n-1, \ alpha / 2} \ cdot \ widehat {se} \ Big] = \ Big [\ bar {X} \ pm \ frac {t_ {n-1, \ alpha / 2}} {\ sqrt {n }} \ cdot s \ Big]. $$
Contrar obiectivului menționat în întrebarea dvs., nu este niciodată o idee bună să raportați intervalul $ \ bar {X} \ pm \ widehat {se} $; acesta este doar un interval de încredere care folosește ciudata cerință că $ t_ {n-1, \ alpha / 2} = 1 $, care probabil va fi înșelător pentru cititorul dvs. În schimb, ar trebui să alegeți un nivel sensibil de încredere de $ 1- \ alpha $ și să acordați un interval de încredere adecvat, raportând nivelul de încredere cititorului dvs.
Cerere pentru datele dvs.: Din analiza dvs. reiese că doriți să agregați datele dvs., ignorând covariabilele valorii timpului și, prin urmare, analizându-le ca un singur eșantion IID. Acesta nu este neapărat cel mai bun mod de a analiza datele, dar voi proceda astfel pentru a vă folosi metoda, pentru a mă concentra asupra aspectelor SEM din întrebarea dvs. Pe această bază, aveți $ n = 30 $ și $ s = 0.7722 $ (pe care l-am calculat din cele treizeci de valori din tabelul dvs.). Eroarea standard estimată a mediei ar trebui să fie apoi $ \ widehat {\ text {se}} = 0.7722 / \ sqrt {30} = 0.1410 $. Nu îmi este clar cum ați obținut valoarea contrară raportată în întrebarea dvs.
În orice caz, puteți vedea că eroarea standard estimată $ \ widehat {\ text {se}} = 0,1410 $ este substanțial mai mică decât deviația standard a eșantionului $ s = 0,7722 $. Așa cum s-a menționat mai sus, acest lucru nu este surprinzător, deoarece prima este deviația standard estimată a unei medii de eșantionare, iar media eșantionului este mai puțin variabilă datorită mediei între mai multe puncte de date. Luând $ \ alpha = 0.05 $ obținem $ t_ {n-1, \ alpha / 2} = t_ {29,0.025} = 2.0452 $, astfel încât intervalul de încredere rezultat de 95 $ $% pentru media populației adevărate este:
$$ \ text {CI} _ \ mu (0.95) = \ Big [7.7920 \ pm 2.0452 \ cdot 0.1410 \ Big] = \ Big [7.7920 \ pm 0.2884 \ Big] = \ Big [7.5038, 8.0804 \ Mare]. $$
După cum sa menționat, această analiză ignoră datele de timp și pur și simplu tratează toate valorile ca un singur eșantion IID, deci este important să ne amintim că acest interval de încredere este condiționat de tratamentul respectiv al datele (care pare a fi ceea ce cauți). Aceasta nu este cea mai bună formă de analiză; o abordare mai bună ar fi utilizarea covariatei de timp într-un model de regresie.
Răspuns
Rețineți că SEM nu este eroarea eșantioanele comparativ cu media, este STD-ul estimatorilor medii.
Pentru a fi mai clar, STD-ul distribuției ar trebui să rămână aproximativ același pe măsură ce mergeți la numărul mare de eșantioane, dar estimatorul mediu de fapt converge și eroarea este la 0.