Jétudie maintenant les t-scores. Pour autant que je sache, les scores t sont utilisés lorsque nous ne connaissons pas les paramètres réels de la population (tels que: écart type et moyenne de la population) et ne pouvons pas utiliser les scores z. Voici la formule qui se trouve dans les livres et sur Internet pour calculer t -score: $$ t = \ frac {\ bar {X} – \ mu} {\ frac {S} {\ sqrt {n}}} $$

Pour autant que je sache μ est utilisé pour définir la vraie moyenne de la population. Donc, dans la formule ci-dessus, jai besoin de la vraie moyenne de la population μ pour calculer le score t. Mais comme je lai déjà dit, quand en calculant le t-score, nous ne connaissons pas les vrais paramètres de population, dans ce cas, la vraie moyenne de la population μ. Alors, quel nombre dois-je utiliser dans μ et comment le calculer?

Aussi pour être clair, il sera très utile si vous fournissez un exemple de t réel -score calcul.

Commentaires

  • Dans un test dhypothèse, le u est la valeur de lhypothèse.
  • Fondamentalement, lorsque vous faites un test t, vous supposez quelque chose pour u. Calculez la moyenne de léchantillon '. Utilisez ces valeurs pour faire le test. Vous navez ' pas besoin de la vraie moyenne de la population.
  • @Student T Vous voulez dire que je devrais utiliser pour μ la moyenne de nombreux autres échantillons? Mais si je nai quun seul échantillon (composé de 30 éléments)?
  • Parlez-vous dun test t? Dans un test t, u est la valeur spécifiée dans lhypothèse nulle. Cette statistique essaie vraiment de transformer la moyenne de votre échantillon en test standard normal à significatif. ' je ne pense pas que cela ait quelque chose à faire avec beaucoup dautres échantillons.
  • @Student TI parle de t-score pour trouver lerreur standard estimée lorsque nous ne ' t ont de vrais paramètres de population (écart-type et moyenne de la population).

Réponse

Pour autant que je sache, μ est utilisé pour définir la vraie moyenne de la population.

Pas tout à fait, et voici le hic. μ représente quelle que soit la vraie signification. Cest défini par le problème pour lequel cette petite inférence statistique est lanalyse, pas par les données elles-mêmes (cela en ferait une estimation, pas une hypothèse)

Donc, dans la formule ci-dessus, jai besoin de la vraie moyenne de la population μ pour calculer le t-score.

Vous avez besoin dune hypothèse sur ce que cest, cest-à-dire: une valeur possible pour cela. Vous navez pas besoin de savoir quelle est vraiment cette valeur.

Mais comme je lai déjà dit lors du calcul du t-score, nous ne connaissons pas les vrais paramètres de population, en dans ce cas, la population vraie signifie μ. Alors, quel nombre utiliser dans μ et comment le calculer?

Un exemple, fait de plusieurs façons

Supposons un instant que vous demandiez à un groupe de sujets destimer le prix de quelque chose – disons un nouveau collège manuel, pour plus de précision – et vous êtes intéressé de savoir sils surestiment ou sous-estiment le prix réel.

Ici, vous pouvez rechercher le prix réel, donc si cest 45 dollars et que les prix sont également en dollars, alors le μ = 45. Si la moyenne des sujets est de 60, votre test t teste sil y a suffisamment de preuves quils surestiment systématiquement le prix ou si leurs suppositions pourraient provenir dune population de sujets qui nont ni sous-estimé ni surestimé le prix du manuel.

En regardant cette autre manière complètement équivalente , vous pouvez soustraire le prix réel de la supposition de chaque sujet. Ensuite, vous regardez les écarts par rapport au prix correct et le test définirait μ = 0 (estimation impartiale du prix)

En regardant une troisième façon, vous pourriez penser à exécuter ce test pour tous valeurs de μ (vous ne feriez pas vraiment cela, mais soyez indulgents avec moi). Pour μs proche de la moyenne des sujets, le test ne «rejettera pas», mais pour μs assez éloigné de la moyenne des sujets, le test rejettera que les données proviennent dune distribution avec cette valeur de μ. La région des valeurs μ pour laquelle le test ne rejette pas est, en un sens, la région des valeurs μ qui sont « raisonnables » à la lumière des données. Cest une façon de motiver lidée (et parfois de construire) un intervalle de confiance. Lorsque lintervalle de confiance (la région des μs non rejetés) ne chevauche pas 45 (ou zéro dans la seconde formulation ), nous rejetons lhypothèse selon laquelle cette population est impartiale dans ses estimations de prix.

Chacune de ces approches vous amène au même endroit dune manière différente. Aucun dentre eux nexige de connaître la vraie valeur de μ. Les deux premiers sont ceux à considérer dans votre cas.

Commentaires

  • Merci pour les explications détaillées.Encore une précision, le test t et la valeur de recherche de t pour notre échantillon sont différents, nest-ce pas? Pour le test t, nous utilisons la formule correspondant à ma question et pour trouver la valeur de t pour notre échantillon, nous utilisons le tableau de score abrégé t qui montre les valeurs de t correspondant à différentes zones sous la distribution normale pour différentes tailles déchantillon (degrés de freadom), ai-je raison? Donc, pour trouver la valeur de t pour notre échantillon, nous navons besoin que de la taille de léchantillon n, le pourcentage de surface en queue (ou queues) et en abrégé Tableau des scores t, ai-je raison?
  • Voici une capture décran du tableau des scores t abrégé de mon manuel: i.imgur.com/Odbm0Qc.png
  • À partir de léchantillon, vous calculez a) les degrés de liberté, qui sont ici un de moins que le nombre dobservations (n), b) la valeur moyenne de léchantillon (barre X), le Écart type de léchantillon. Lorsque vous faites une hypothèse sur la moyenne de la population (μ), tout est prêt pour calculer la statistique (t). Le ' tableau t-score ' vous permet de choisir parmi différents ' niveaux de signification ' pour votre test.
  • En suivant mon exemple, émettez lhypothèse que la moyenne de la population était de 45 (μ = 45). Vous obtenez des prix de dix personnes (n = 10) et ces estimations en moyenne cinquante (X-bar = 50) avec un écart type de cinq (s = 5). La statistique t est donc 3,16. La colonne du milieu donne des nombres dont t devrait être plus grand en valeur absolue quà rejeter (que μ = 45) dans un test bilatéral au ' niveau ' 0,05 pour différents degrés de liberté. Ici, vous avez n-1 = 9, donc le nombre doit être supérieur à 2,262. 3.16 est plus grand que cela, vous pouvez donc rejeter p < .05 que μ = 45 dans la population dont il sagit dun échantillon.
  • Je peux aussi calculer t score pour un élément individuel de mon échantillon, non? Quelle formule utiliser pour cela t=(X-μ)/S ou t=(X-μ)/estimated standard error? Je pense que je dois utiliser le premier, ai-je raison? Dans ces formules, μ est la taille de léchantillon, X est la valeur de lélément, S écart type de léchantillon .

Réponse

Il y a deux $ \ mu $ « différents impliqués ici:

  1. lhypothèse signifie que vous utilisez dans le numérateur de votre t-statistique pour un t-test (parfois noté $ \ mu_0 $), et
  2. le vraie moyenne de population, $ \ mu $.

Le test t consiste en fait à voir si la vraie moyenne de population diffère de la moyenne hypothétique – cest-à-dire quil sagit dun test pour un nul hypothèse $ H_0 \!: \, \ mu = \ mu_0 $.

Ne confondez pas $ \ mu $ avec $ \ mu_0 $. Un seul des deux est connu.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *