Esta é a minha consulta.

Tenho 6 participantes, onde as leituras de glicose estão sendo feitas em 30 minutos, 60 .. até 150 minutos. Portanto, no total, tenho 30 pontos de dados

Para cada intervalo de tempo, calculei uma leitura média de glicose para todos os 6 participantes por exemplo, 1. média dos participantes em 30 minutos é 7,96, SD é 0,92, SEM é 0,38 2. média dos participantes em 60 minutos é 7,68, SD é 0,93, SEM é 0,38

Os outros valores SEM são 0,27 , 0,35, 0,25.

Agora, para um cálculo estatístico, preciso calcular a média ± SEM de todos os pontos de dados. A média é fácil – calcule a média de todos os 30. Mas para o SEM, se eu tentar para calculá-lo através do método normal do Excel, acabo com um valor de 0,089 .. que, ao relatar, me dá 7,79 ± 0,08. O que é obviamente muito pequeno para isso, pois os valores variam de 6,69 a 9,17.

Existe um cálculo que estou perdendo? Devo estar apenas somando / calculando a média do SEM para os pontos de tempo?

Agradecemos antecipadamente!

Consegui enviar uma imagem da tabela de dados: Tabela de dados

Comentários

  • Você poderia esclarecer exatamente o que você precisa relatar? Como @Cherny sugere, a maneira exata de fazer isso depende da pergunta exata que você precisa responder. Se você não tiver certeza, forneça qualquer orientação que tenha ou que pergunta deseja abordar com esta análise

Resposta

O erro padrão é o desvio padrão de um estimador ; o SEM, portanto, surge quando você está usando a média da amostra como um estimador da verdadeira média da população subjacente. Nesse caso, o erro padrão estimado geralmente será muito menor do que o desvio padrão da amostra dos pontos de dados originais, uma vez que o estimador médio é menos variável do que os próprios dados.

Para ver como isso funciona mais especificamente , seja $ X_1, …, X_n \ sim \ text {IID Dist} $ seus valores de amostra observáveis e seja $ \ bar {X} = \ sum_ {i = 1} ^ n X_i / n $ a amostra resultante média, que é considerada um estimador da média da população subjacente $ \ mu = \ mathbb {E} (X_i) $. Se deixarmos $ \ sigma ^ 2 = \ mathbb {V} (X_i) $ ser a variância da população subjacente, então o verdadeiro erro padrão da média da amostra é:

$$ \ begin {equation} \ begin {alinhado} \ text {se} \ equiv \ text {se} (\ bar {X}) \ equiv \ mathbb {S} (\ bar {X}) & = \ sqrt {\ mathbb {V} (\ bar {X})} \\ [6pt] & = \ sqrt {\ mathbb {V} \ Big (\ frac {1} { n} \ sum_ {i = 1} ^ n X_i \ Big)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ { i = 1} ^ n \ mathbb {V} (X_i)} \\ [6pt] & = \ sqrt {\ frac {1} {n ^ 2} \ sum_ {i = 1} ^ n \ sigma ^ 2} \\ [6pt] & = \ sqrt {\ frac {n \ sigma ^ 2} {n ^ 2}} \\ [6pt ] & = \ sqrt {\ frac {\ sigma ^ 2} {n}} \\ [6pt] & = \ frac { \ sigma ^ 2} {\ sqrt {n}}. \\ [6pt] \ end {align} \ end {equation} $$

Substituir o parâmetro desconhecido $ \ sigma $ pelo desvio padrão da amostra observável $ s $ produz o erro padrão estimado :

$$ \ widehat {\ text {se}} = \ frac {s ^ 2} {\ sqrt {n}}. $$

O erro padrão estimado é e não uma estimativa da dispersão de os dados subjacentes; é uma estimativa da dispersão do estimador em seu problema, que é a média da amostra neste caso. Como as médias da amostra sobre todos os valores observados, é muito menos variável do que os valores iniciais. Especificamente, podemos ver a partir do resultado acima que o erro padrão estimado da média é igual ao desvio padrão da amostra dos dados subjacentes, dividido por $ \ sqrt {n} $. Agora, obviamente, conforme $ n $ fica maior, o SEM será substancialmente menor do que o desvio padrão da amostra dos dados subjacentes.

Depois de calcular o SEM estimado, é comum usar isso para forneça um intervalo de confiança para a média da população subjacente verdadeira $ \ mu $ em algum nível de confiança especificado $ 1- \ alpha $. Isso pode ser feito usando a fórmula de intervalo padrão para uma média populacional:

$$ \ text {CI} _ \ mu (1- \ alpha) = \ Big [\ bar {X} \ pm t_ { n-1, \ alpha / 2} \ cdot \ widehat {se} \ Big] = \ Big [\ bar {X} \ pm \ frac {t_ {n-1, \ alpha / 2}} {\ sqrt {n }} \ cdot s \ Big]. $$

Ao contrário do objetivo declarado em sua pergunta, nunca é uma boa ideia relatar o intervalo $ \ bar {X} \ pm \ widehat {se} $; este é apenas um intervalo de confiança usando o estranho requisito de que $ t_ {n-1, \ alpha / 2} = 1 $, o que pode ser enganoso para o seu leitor. Em vez disso, você deve escolher um nível de confiança razoável $ 1- \ alpha $ e fornecer um intervalo de confiança adequado, relatando seu nível de confiança ao leitor.


Aplicação aos seus dados: Parece a partir de sua análise que você está procurando agregar seus dados, ignorando as covariáveis do valor de tempo e, portanto, analisando-os como uma única amostra IID. Essa não é necessariamente a melhor forma de analisar os dados, mas irei proceder dessa forma para usar o seu método, para focar nos aspectos do SEM da sua pergunta. Nesta base, você tem $ n = 30 $ e $ s = 0,7722 $ (que calculei a partir dos trinta valores em sua tabela). O erro padrão estimado da média deve ser $ \ widehat {\ text {se}} = 0,7722 / \ sqrt {30} = 0,1410 $. Não está claro para mim como você obteve o valor contrário relatado em sua pergunta.

Em qualquer caso, você pode ver que o erro padrão estimado $ \ widehat {\ text {se}} = 0,1410 $ é substancialmente inferior ao desvio padrão da amostra $ s = 0,7722 $. Conforme observado acima, isso não é surpreendente, uma vez que o primeiro é o desvio padrão estimado de uma média da amostra e a média da amostra é menos variável devido à média em vários pontos de dados. Tomando $ \ alpha = 0,05 $ obtemos $ t_ {n-1, \ alpha / 2} = t_ {29,0.025} = 2,0452 $, então o intervalo de confiança de $ 95 $% resultante para a verdadeira média da população é:

$$ \ text {CI} _ \ mu (0,95) = \ Grande [7,7920 \ pm 2,0452 \ cdot 0,1410 \ Grande] = \ Grande [7,7920 \ pm 0,2884 \ Grande] = \ Grande [7,5038, 8,0804 \ Big]. $$

Conforme observado, esta análise ignora os dados de tempo e simplesmente trata todos os valores como uma única amostra IID, por isso é importante lembrar que este intervalo de confiança depende do tratamento de os dados (que parecem ser o que você procura). Esta não é a melhor forma de análise; uma abordagem melhor seria usar a covariável de tempo em um modelo de regressão.

Resposta

Observe que SEM não é o erro de as amostras em comparação com a média, é o STD dos estimadores médios.

Para ser mais claro, o STD da distribuição deve permanecer quase o mesmo quando você vai para um grande número de amostras, mas o estimador médio, na verdade converge e seu erro vai para 0.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *