Ahora estoy estudiando t-score. Por lo que tengo entendido, las puntuaciones t se utilizan cuando no conocemos los parámetros reales de la población (como la desviación estándar y la media de la población) y no podemos utilizar puntuaciones z. Aquí tienes una fórmula que se encuentra en los libros y en Internet para calcular t -puntuación: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$

Hasta donde yo sé μ se usa para definir la media de población real. Por lo tanto, en la fórmula anterior necesito la media de población real μ para calcular la puntuación t. Pero, como dije antes, cuando Al calcular la puntuación t, no conocemos los parámetros de la población real, en este caso la media de la población real es μ. Entonces, ¿qué número debería usar en μ y cómo calcularlo?

También para aclararlo, será muy útil si proporciona un ejemplo de t real -cálculo de puntuación.

Comentarios

  • En una prueba de hipótesis, la u es el valor de la hipótesis.
  • Básicamente, al hacer una prueba t, asumes algo para ti. Calcule el promedio de ' s de la muestra. Utilice esos valores para hacer la prueba. Simplemente no ' no necesitas la media de población real.
  • @Student T Quieres decir que debería usar para μ la media de muchas otras muestras? ¿Pero si solo tengo una muestra (que consta de 30 elementos)?
  • ¿Estás hablando de una prueba t? En una prueba t, u es el valor especificado en la hipótesis nula. Esta estadística realmente está tratando de transformar el promedio de la muestra en la prueba estándar de normal a significancia. No ' creo que tenga algo que ver con muchas otras muestras.
  • @Student TI estoy hablando de t-score para encontrar el error estándar estimado cuando no ' no tienen parámetros de población verdaderos (desviación estándar y media de población).

Respuesta

Hasta donde yo sé, μ se usa para definir la media real de la población.

No exactamente, y aquí está el problema. μ representa cualquiera que sea el verdadero significado. Es definido por el problema para el cual esta pequeña inferencia estadística es el análisis, no por los datos en sí mismos (que lo convertirían en una estimación, no en una hipótesis)

Entonces, en la fórmula anterior, necesito la media real de la población μ para calcular la puntuación t.

Necesitas una hipótesis sobre qué es, es decir: un posible valor para él. No necesita saber cuál es realmente ese valor.

Pero, como dije antes, al calcular la puntuación t, no conocemos los parámetros de población reales, en en este caso, la población real media μ. Entonces, ¿qué número debería usar en μ y cómo calcularlo?

Un ejemplo, hecho de varias maneras

Suponga por un momento que pide que un grupo de sujetos estimen el precio de algo, digamos una nueva universidad libro de texto, por concreción, y le interesa si sobreestiman o subestiman el precio real.

Aquí puede buscar el precio real, por lo que si es de 45 dólares y las estimaciones del precio también están en dólares, entonces μ = 45. Si la estimación promedio de los sujetos es 60, entonces su prueba t está probando si hay suficiente evidencia de que están sobrestimando sistemáticamente el precio o si sus conjeturas podrían haber provenido de una población de sujetos que ni subestimaron ni sobrestimaron el precio del libro de texto.

Mirando esta otra forma completamente equivalente , puede restar el precio real de la suposición de cada sujeto. Luego, está observando las desviaciones del precio correcto y la prueba establecería μ = 0 (estimación de precio imparcial)

Visto de una tercera forma, podría pensar en ejecutar esta prueba para todos valores de μ (realmente no haría esto, pero tenga paciencia conmigo). Para μs cerca del promedio de los sujetos, la prueba «no rechazará», pero para μs bastante lejos del promedio de los sujetos, la prueba rechazará que los datos provengan de una distribución con ese valor de μ. La región de valores de μ para la que la prueba no rechaza es, en cierto sentido, la región de valores de μ que son «razonables» a la luz de los datos. Esta es una forma de motivar la idea de (y, a veces, de hecho, construir) un intervalo de confianza. Cuando el intervalo de confianza (la región de μs no rechazados) no se superpone a 45 (o cero en la segunda formulación ), luego rechazamos la hipótesis de que esta población es imparcial en la estimación del precio de los libros de texto.

Cada uno de estos enfoques lo lleva al mismo lugar de una manera diferente. Ninguno de ellos requiere conocer el verdadero valor de μ. Los dos primeros son los que debe considerar en su caso.

Comentarios

  • Gracias por la explicación detallada.Una aclaración más, la prueba t y el valor de búsqueda de t para nuestra muestra son diferentes, ¿verdad? Para la prueba t usamos la fórmula que está en mi pregunta y para encontrar el valor de t para nuestra muestra, usamos una tabla de puntuación t abreviada que muestra los valores de t correspondientes a diferentes áreas bajo la distribución normal para varios tamaños de muestra (grados de freadom), ¿verdad? Entonces, para encontrar el valor de t para nuestra muestra, solo necesitamos el tamaño de muestra n, el porcentaje de área en la cola (o colas) y abreviado t tabla de puntuación, ¿verdad?
  • Aquí hay una captura de pantalla de la tabla de puntuación t abreviada de mi libro de texto: i.imgur.com/Odbm0Qc.png
  • De la muestra se calcula a) los grados de libertad, que aquí es uno menos que el número de observaciones (n), b) el valor promedio de la muestra (barra X), el desviación estándar muestral. Cuando hace una hipótesis sobre la media poblacional (μ), entonces tiene todo listo para calcular la estadística (t). La ' tabla de puntuación t ' le permite elegir entre algunos ' niveles de significancia ' para su prueba.
  • Siguiendo mi ejemplo, haga la hipótesis de que la media de la población era 45 (μ = 45). Obtienes precios de diez personas (n = 10) y estas estimaciones promedian cincuenta (barra X = 50) con una desviación estándar de cinco (s = 5). Entonces, el estadístico t es 3.16. La columna del medio da números que t deberían ser más grandes en valor absoluto que para rechazar (que μ = 45) en una prueba de dos colas en el ' nivel ' 0.05 para varios grados de libertad. Aquí tiene n-1 = 9, por lo que el número debe ser mayor que 2.262. 3.16 es mayor que esto, por lo que puede rechazar p < .05 que μ = 45 en la población de la que esta es una muestra.
  • También puedo calcular t puntuación para un elemento individual de mi muestra, ¿verdad? ¿Qué fórmula usar para ello t=(X-μ)/S o t=(X-μ)/estimated standard error? Creo que necesito usar el primero, ¿verdad? En esas fórmulas, μ es el tamaño de la muestra, X es el valor del elemento, S desviación estándar de la muestra .

Respuesta

Hay dos $ \ mu $ «s diferentes involucrados aquí:

  1. la media hipotética que utiliza en el numerador de su estadística t para una prueba t (a veces denotada como $ \ mu_0 $), y
  2. la media de la población real, $ \ mu $.

La prueba t es en realidad para ver si la media de la población real difiere de la media hipotética, es decir, es una prueba para un valor nulo hipótesis $ H_0 \!: \, \ mu = \ mu_0 $.

No confunda $ \ mu $ con $ \ mu_0 $. Solo se conoce uno de los dos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *