여기에 내 쿼리가 있습니다.

6 개가 있습니다. 30 분, 60 .. 최대 150 분에 포도당 수치를 측정하는 참가자. 따라서 총 30 개의 데이터 포인트가 있습니다.

각 시간대에 대해 6 명의 참가자 모두에 대한 평균 포도당 수치를 계산했습니다. 예 1. 30 분 참가자의 평균은 7.96, SD는 0.92, SEM은 0.38입니다. 2. 60 분 참가자의 평균은 7.68, SD는 0.93, SEM은 0.38입니다.

다른 SEM 값은 0.27입니다. , 0.35, 0.25.

이제 통계 계산을 위해 모든 데이터 포인트에 대한 평균 ± SEM을 계산해야합니다. 평균은 간단합니다. 30 개 모두 평균을냅니다.하지만 SEM의 경우 시도해 보면 일반 엑셀 방법을 통해 계산하면 0.089 .. 값이됩니다.보고 할 때 7.79 ± 0.08이됩니다. 값이 6.69-9.17 범위이므로이 값은 분명히 너무 작습니다.

내가 누락 된 계산이 있습니까? 해당 시점의 SEM을 합산 / 평균화해야합니까?

미리 감사합니다!

데이터 테이블 사진 업로드 관리 : 데이터 표

댓글

  • 정확히 설명 하시겠습니까? 무엇을보고해야합니까? @Cherny가 정확한 방법을 제안했듯이 대답해야 할 정확한 질문에 따라 다릅니다. 확실하지 않은 경우이 분석을 통해 어떤 지침이나 해결하려는 질문을 제공하십시오.

답변

표준 오차 추정기 의 표준 편차입니다. 따라서 SEM은 표본 평균을 실제 기본 모집단 평균의 추정량으로 사용할 때 발생합니다. 이 경우, 평균 추정치는 데이터 자체보다 변수가 적기 때문에 추정 된 표준 오차는 일반적으로 원래 데이터 포인트의 표본 표준 편차보다 훨씬 작습니다.

이게 어떻게 작동하는지 자세히 알아 보려면 , $ X_1, …, X_n \ sim \ text {IID Dist} $를 관찰 가능한 샘플 값으로하고 $ \ bar {X} = \ sum_ {i = 1} ^ n X_i / n $를 결과 샘플로 지정합니다. 평균은 기본 모집단의 추정치로 간주됩니다. 평균 $ \ mu = \ mathbb {E} (X_i) $. $ \ sigma ^ 2 = \ mathbb {V} (X_i) $를 기본 모집단 분산으로두면 표본 평균의 실제 표준 오차는 다음과 같습니다.

$$ \ begin {equation} \ begin {aligned} \ text {se} \ equiv \ text {se} (\ bar {X}) \ equiv \ mathbb {S} (\ bar {X}) & = \ sqrt {\ mathbb {V} (\ bar {X})} \\ [6pt] & = \ sqrt {\ mathbb {V} \ Big (\ frac {1} { n} \ sum_ {i = 1} ^ n X_i \ Big)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ { i = 1} ^ n \ mathbb {V} (X_i)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ {i = 1} ^ n \ sigma ^ 2} \\ [6pt] & = \ sqrt {\ frac {n \ sigma ^ 2} {n ^ 2}} \\ [6pt ] & = \ sqrt {\ frac {\ sigma ^ 2} {n}} \\ [6pt] & = \ frac { \ sigma ^ 2} {\ sqrt {n}}. \\ [6pt] \ end {aligned} \ end {equation} $$

알 수없는 매개 변수 $ \ sigma $를 관찰 가능한 표본 표준 편차 $ s $로 대체하면 예상 표준 오류 :

$$ \ widehat {\ text {se}} = \ frac {s ^ 2} {\ sqrt {n}}. $$

예상 표준 오차는 분산의 추정치가 아닙니다 기초 데이터; 문제에서 추정기 의 산포 추정치이며이 경우의 표본 평균입니다. 표본 평균은 관찰 된 모든 값에 대해 평균을 내기 때문에 초기 값보다 훨씬 덜 가변적입니다. 특히, 위의 결과에서 평균의 추정 표준 오차가 $ \ sqrt {n} $로 나눈 기본 데이터의 표본 표준 편차와 같다는 것을 알 수 있습니다. 이제 분명히 $ n $가 커지면 SEM은 기본 데이터의 표본 표준 편차보다 훨씬 작을 것입니다.

추정 된 SEM을 계산 한 후에는 일반적으로이를 사용하여 실제 기본 모집단에 대한 신뢰 구간 을 제공하면 특정 신뢰 수준 $ 1- \ alpha $에서 $ \ mu $를 의미합니다. 모집단 평균에 대한 표준 간격 공식을 사용하여 수행 할 수 있습니다.

$$ \ text {CI} _ \ mu (1- \ alpha) = \ Big [\ bar {X} \ pm t_ { n-1, \ alpha / 2} \ cdot \ widehat {se} \ Big] = \ Big [\ bar {X} \ pm \ frac {t_ {n-1, \ alpha / 2}} {\ sqrt {n }} \ cdot s \ Big]. $$

질문에 명시된 목표와 달리 간격을보고하는 것은 결코 좋은 생각이 아닙니다 $ \ bar {X} \ pm \ widehat {se} $; 이것은 독자에게 오해의 소지가있는 $ t_ {n-1, \ alpha / 2} = 1 $라는 이상한 요구 사항을 사용한 신뢰 구간입니다. 대신 합리적인 신뢰 수준 $ 1- \ alpha $를 선택하고 적절한 신뢰 구간을 제공하여 신뢰 수준을 독자에게보고해야합니다.


데이터 적용 : 분석 결과 집계하려는 것으로 보입니다. 시간 값을 무시하고 데이터를 공변량하므로 단일 IID 샘플로 분석합니다. 이것이 반드시 데이터를 분석하는 가장 좋은 방법은 아니지만 귀하의 방법을 사용하고 귀하의 질문에서 SEM의 측면에 초점을 맞추기 위해이 방식으로 진행할 것입니다. 이를 기준으로 $ n = 30 $ 및 $ s = 0.7722 $ (표의 30 개 값에서 계산)가 있습니다. 평균의 추정 표준 오차는 $ \ widehat {\ text {se}} = 0.7722 / \ sqrt {30} = 0.1410 $이되어야합니다. 귀하의 질문에서 어떻게 반대 값이보고되었는지 확실하지 않습니다.

어쨌든 추정 표준 오류 $ \ widehat {\ text {se}} = 0.1410 $이 실질적으로 표본 표준 편차 $ s = 0.7722 $보다 낮습니다. 위에서 언급했듯이 전자는 표본 평균의 추정 된 표준 편차이고 표본 평균은 여러 데이터 포인트에 대한 평균화로 인해 덜 가변적이기 때문에 이것은 놀라운 일이 아닙니다. $ \ alpha = 0.05 $를 사용하면 $ t_ {n-1, \ alpha / 2} = t_ {29,0.025} = 2.0452 $를 얻습니다. 따라서 실제 모집단 평균에 대한 $ 95 $ % 신뢰 구간은 다음과 같습니다.

$$ \ text {CI} _ \ mu (0.95) = \ Big [7.7920 \ pm 2.0452 \ cdot 0.1410 \ Big] = \ Big [7.7920 \ pm 0.2884 \ Big] = \ Big [7.5038, 8.0804 \ Big]. $$

설명했듯이이 분석은 시간 데이터를 무시하고 모든 값을 단일 IID 샘플로 처리하기 때문에이 신뢰 구간은 다음과 같은 처리에 따라 달라진다는 점을 기억하는 것이 중요합니다. 데이터 (당신이 추구하는 것 같습니다). 이것은 최상의 분석 형식이 아닙니다. 더 나은 접근 방식은 회귀 모델에서 시간 공변량을 사용하는 것입니다.

Answer

SEM은 평균과 비교 한 샘플은 평균 추정 자의 STD입니다.

더 명확하게 말하면 분포의 STD는 큰 샘플 수로 이동하는 것과 거의 동일해야하지만 실제로는 평균 추정치입니다. 수렴하고 오류가 0이됩니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다