Jai une tâche à partir de laquelle je voudrais trouver le niveau de confiance donné la valeur z. Jai un échantillon de population. À partir de cette population, compte tenu de sa répartition, jaimerais trouver le niveau de confiance dune valeur donnée de cette population. En dautres termes, étant donné une valeur a de la population, jaimerais savoir si elle se situe à moins de 95% (niveau de confiance) de lensemble de la population ou de 68% ou 50% et ainsi de suite. Habituellement, nous pouvons trouver la valeur z et lintervalle de confiance et le niveau de confiance donné comme expliqué ici Comment trouver lintervalle de confiance . Mais jaimerais trouver le niveau de confiance étant donné la valeur z (qui dans ce cas est une valeur donnée de la population).
Comment puis-je résoudre ce problème? Si possible, il doit être en python ou en R
Réponse
OK, pour un intervalle de confiance de 95%, vous voulez savoir le nombre décarts-types par rapport à la moyenne de votre estimation ponctuelle (le «score z»). Pour obtenir cela, vous enlevez les 5% de « queues ». En travaillant sous forme de centile, vous avez 100-95, ce qui donne une valeur de 5 ou 0,05 sous forme décimale.
Divisez cela en deux pour obtenir 0,025 puis, dans R, utilisez la fonction qnorm pour obtenir létoile z (« valeur critique »). Puisque vous ne vous souciez que dun « côté » de la courbe (les valeurs de chaque côté sont des images en miroir lune de lautre) et que vous voulez un nombre positif, passez largument lower.tail = FALSE.
Donc, à la fin, cela ressemblerait à ceci:
qnorm(.025,lower.tail=FALSE)
donnant une valeur de 1,959964
Vous branchez ensuite cette valeur dans léquation de la marge derreur pour finir les choses.
Si vous voulez aller dans lautre sens, dune « valeur critique » à une probabilité, utilisez la fonction pnorm. Quelque chose comme:
pnorm(1.959964,lower.tail=FALSE)
qui vous rendra 0,025
Commentaires
- Jaurais pu mieux formuler cela, mais le net-net est " use qnorm / pnorm ".
Réponse
Pour effectuer une conversion entre les scores z et les valeurs de confiance avec python, utilisez le cdf
et ppf
fonctions dans scipy.stats.norm .
Il y a un bel exemple de comment les utiliser dans la réponse à cette question .