Mám úkol, od kterého bych chtěl najít úroveň spolehlivosti vzhledem k hodnotě z. Mám vzorek populace. Z této populace, vzhledem k jejímu rozdělení, bych chtěl najít úroveň spolehlivosti dané hodnoty této populace. Jinými slovy, vzhledem k hodnotě populace bych chtěl vědět, jestli je v rámci 95% (úroveň spolehlivosti) celé populace nebo 68% nebo 50% atd. Obvykle můžeme najít hodnotu z a interval spolehlivosti a danou úroveň spolehlivosti, jak je vysvětleno zde Jak najít interval spolehlivosti . Rád bych ale zjistil úroveň spolehlivosti vzhledem k hodnotě z (což je v tomto případě daná hodnota z populace).
Jak to mohu vyřešit? Pokud je to možné, mělo by to být v pythonu nebo v R
Odpověď
Dobře, pro 95% interval spolehlivosti chcete vědět kolik standardních odchylek od průměru je váš bodový odhad („skóre z“). Abyste toho dosáhli, sundáte 5% „ocasy“. Při práci v percentilové formě máte 100-95, což dává hodnotu 5 nebo 0,05 v desítkové formě.
Rozdělte to na polovinu, abyste získali 0,025, a pak v R použijte funkci qnorm k získání z-hvězdy („kritická hodnota“). Jelikož vám záleží pouze na jedné „straně“ křivky (hodnoty na obou stranách jsou vzájemně zrcadlovými obrazy) a chcete kladné číslo, předejte argument lower.tail = FALSE.
Takže by to nakonec vypadalo takto:
qnorm(.025,lower.tail=FALSE)
s hodnotou 1,959964
Tuto hodnotu potom připojíte do rovnice pro okraj chyby, abyste věci dokončili.
Pokud se chcete vydat opačným směrem, od „kritické hodnoty“ k pravděpodobnosti, použijte funkci pnorm. Něco jako:
pnorm(1.959964,lower.tail=FALSE)
, které vám vrátí 0,025
Komentáře
- Mohl jsem to zformulovat lépe, ale net-net je " použít qnorm / pnorm ".
Odpověď
Chcete-li převést mezi z-skóre a hodnotami spolehlivosti pomocí pythonu, použijte cdf
a ppf
funkce v scipy.stats.norm .
Existuje pěkný příklad jak je použít v odpovědi na tuto otázku .