Ik heb een taak waarvan ik het betrouwbaarheidsniveau zou willen vinden gezien de z-waarde. Ik heb een steekproefpopulatie. Uit die populatie, gezien de spreiding ervan, zou ik graag het betrouwbaarheidsniveau van een bepaalde waarde van die populatie willen weten. Met andere woorden, gegeven een waarde van de populatie, zou ik graag willen weten of deze binnen 95% (betrouwbaarheidsniveau) van de hele populatie ligt of 68% of 50% enzovoort. Gewoonlijk kunnen we de z-waarde en het betrouwbaarheidsinterval en het gegeven betrouwbaarheidsniveau vinden, zoals hier wordt uitgelegd Hoe het betrouwbaarheidsinterval te vinden . Maar ik zou graag het betrouwbaarheidsniveau willen vinden gezien de z-waarde (wat in dit geval een gegeven waarde is van de populatie).
Hoe kan ik dit aanpakken? Indien mogelijk zou het in python of in R moeten zijn
Answer
OK, voor een betrouwbaarheidsinterval van 95% wil je het weten hoeveel standaarddeviaties verwijderd van het gemiddelde uw puntschatting is (de “z-score”). Om dat te krijgen, verwijder je de 5% “staarten”. Als je in percentielvorm werkt, heb je 100-95, wat een waarde van 5 oplevert, of 0,05 in decimale vorm.
Verdeel dat in twee om 0,025 te krijgen en gebruik dan, in R, de functie qnorm om de z-ster (“kritische waarde”) te krijgen. Aangezien u slechts om één “kant” van de curve geeft (de waarden aan beide kanten zijn spiegelbeelden van elkaar) en u een positief getal wilt, geeft u het argument lower.tail = FALSE door.
Dus uiteindelijk zou het er als volgt uitzien:
qnorm(.025,lower.tail=FALSE)
wat een waarde oplevert van 1.959964
Vervolgens plug je die waarde in de vergelijking voor de foutmarge om de zaken af te maken.
Als je de andere richting wilt gaan, van een “kritische waarde” naar een waarschijnlijkheid, gebruik dan de functie pnorm. Iets als:
pnorm(1.959964,lower.tail=FALSE)
wat je 0,025 teruggeeft
Reacties
- Ik had dat beter kunnen verwoorden, maar het net-net is " use qnorm / pnorm ".
Answer
Gebruik de cdf
om tussen z-scores en betrouwbaarheidswaarden met python te converteren en ppf
functies in scipy.stats.norm .
Er is een mooi voorbeeld van hoe ze te gebruiken in het antwoord voor deze vraag .