Estou estudando agora pontuações t. Pelo que entendi, os escores t são usados quando não sabemos os parâmetros reais da população (como: desvio padrão e média da população) e não podemos usar escores z. Aqui está a fórmula que está em livros e na Internet para calcular t -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$
Tanto quanto eu sei μ
é usado para definir a média populacional verdadeira. Na fórmula acima, preciso da média populacional verdadeira μ
para calcular o escore t. Mas, como disse antes, quando calculando o t-score, não sabemos os verdadeiros parâmetros da população, neste caso a verdadeira média da população μ
. Então, qual número devo usar em μ
e como calculá-lo?
Além disso, para deixar claro, será muito útil se você fornecer um exemplo de t real – cálculo de pontuação.
Comentários
Resposta
Tanto quanto eu sei, μ é usado para definir a verdadeira média da população.
Não exatamente, e aqui está o problema. μ representa qualquer que seja a verdadeira média. É “s definido pelo problema para o qual este pequeno bit de inferência estatística é a análise, não pelos dados em si (isso seria uma estimativa, não uma hipótese)
Portanto, na fórmula acima, preciso da média real da população μ para calcular o t-score.
Você precisa de uma hipótese sobre o que é, isto é: um possível valor para ele. Você não precisa saber qual é realmente esse valor.
Mas como eu disse antes, ao calcular o t-score, não sabemos os verdadeiros parâmetros da população, em neste caso a população verdadeira significa μ. Então, qual número devo usar em μ e como calculá-lo?
Um exemplo, feito de algumas maneiras
Suponha por um momento que você peça que um grupo de disciplinas estime o preço de algo – digamos, uma nova faculdade livro, para concretude – e você “está interessado se eles superestimam ou subestimam o preço real.
Aqui você pode procurar o preço real, então se for 45 dólares e as estimativas de preço também forem em dólares, então o µ = 45. Se a estimativa média do sujeito for 60, então seu teste t está testando se há evidências suficientes de que eles estão sistematicamente superestimando o preço ou se seus palpites podem ter vindo de uma população de indivíduos que não subestimou nem subestimou o preço do livro didático.
Olhando para esta outra maneira completamente equivalente , você pode subtrair o preço real do palpite de cada sujeito. Então, você está observando os desvios do preço correto e o teste definiria μ = 0 (estimativa de preço imparcial)
Em uma terceira maneira, você pode pensar em executar este teste para todos valores de μ (você não faria isso realmente, mas tenha paciência comigo). Para μs perto da média dos sujeitos, o teste “não rejeitará”, mas para μs muito longe da média dos sujeitos, o teste irá rejeitar que os dados vieram de uma distribuição com aquele valor de μ. A região dos valores de μ para os quais o teste não rejeita é, em certo sentido, a região dos valores de μ que são “razoáveis” à luz dos dados. Esta é uma maneira de motivar a ideia de (e às vezes realmente construir) um intervalo de confiança. Quando o intervalo de confiança (a região de μs não rejeitados) não se sobrepõe a 45 (ou zero na segunda formulação ), então rejeitamos a hipótese de que essa população é imparcial em suas estimativas de preços de livros didáticos.
Cada uma dessas abordagens leva você ao mesmo lugar de uma maneira diferente. Nenhum deles requer o conhecimento do verdadeiro valor de µ. Os dois primeiros são aqueles a serem considerados no seu caso.
Comentários
- Obrigado pela explicação detalhada.Mais um esclarecimento, o teste t e o valor encontrado de
t
para a nossa amostra são diferentes, certo? Para o teste t, usamos a fórmula que está em minha dúvida e para encontrar o valor det
para nossa amostra, estamos usando uma tabela de pontuaçãot
abreviada que mostra os valores det
correspondentes a diferentes áreas sob a distribuição normal para vários tamanhos de amostra (graus de freadom), estou certo? Portanto, para encontrar o valor det
para nossa amostra, precisamos apenas do tamanho da amostran
, a porcentagem de área na cauda (ou caudas) e abreviado Tabela de pontuação t, estou certo? - Aqui está a captura de tela da tabela de pontuação t abreviada do meu livro: i.imgur.com/Odbm0Qc.png
- A partir da amostra, você calcula a) os graus de liberdade, que aqui são um a menos que o número de observações (n), b) o valor médio da amostra (barra X), o desvio padrão da amostra. Quando você faz uma hipótese sobre a média da população (μ), você tem tudo pronto para calcular a estatística (t). A ' tabela t-score ' permite que você escolha entre alguns ' níveis diferentes de significância ' para o seu teste.
- Seguindo meu exemplo, suponha que a média da população fosse 45 (μ = 45). Você obtém preços de dez pessoas (n = 10) e essas estimativas são em média cinquenta (X-bar = 50) com desvio padrão de cinco (s = 5). Portanto, a estatística t é 3,16. A coluna do meio fornece números que t deve ser maior em valor absoluto do que rejeitar (que μ = 45) em um teste bicaudal no ' nível ' 0,05 para vários graus de liberdade. Aqui você tem n-1 = 9, então o número a ser maior que 2,262. 3,16 é maior do que isso, então você pode rejeitar p < .05 que μ = 45 na população da qual esta é uma amostra.
- Também posso calcular pontuação t para elemento individual da minha amostra, certo? Qual fórmula usar para isso
t=(X-μ)/S
out=(X-μ)/estimated standard error
? Acho que preciso usar primeiro, certo? Nas fórmulas,μ
é o tamanho da amostra,X
é o valor do elemento,S
desvio padrão da amostra .
Resposta
Existem dois $ \ mu $ “s diferentes envolvidos aqui:
- a média hipotética que você usa no numerador de sua estatística t para um teste t (às vezes denotado como $ \ mu_0 $), e
- o verdadeira média da população, $ \ mu $.
O teste t serve para ver se a verdadeira média da população difere da média hipotética – isto é, é um teste para um valor nulo hipótese $ H_0 \!: \, \ mu = \ mu_0 $.
Não confunda $ \ mu $ com $ \ mu_0 $. Apenas um dos dois é conhecido.
μ
a média de muitas outras amostras? Mas se eu tiver apenas uma amostra (consistindo em 30 elementos)?