Moje otázka souvisí se vztahem mezi alfa a beta a jejich definicemi ve statistikách.

alpha = míra chyb typu I = úroveň významnosti vzhledem k tomu, že hypotéza NULL je správná

Beta = míra chyb typu II

Pokud je alfa snížena (specificita se zvyšuje jako alpha = 1- specificita ), beta se zvyšuje (citlivost / výkon klesá s beta = 1 – citlivost / výkon)

Jak změna alfa ovlivní beta? Existuje lineární vztah nebo ne? Je poměr alfa / beta vždy stejný, jinými slovy je poměrová specificita / citlivost vždy stejná? Pokud ano, znamená to, že pomocí Bonferroniho korekce pouze přecházíme na nižší citlivost a vyšší specificitu, ale neměníme poměr citlivosti / specificity. Je správné to říkat?

Aktualizace (otázka pro konkrétní případ):

U daného experimentálního návrhu spustíme na datech 5 lineárních modelů. Máme skutečnou pozitivní frekvenci (citlivost / sílu) na 0,8 a skutečnou negativní frekvenci (specificitu) na 0,7. (Představme si, že víme, co by mělo být kladné a co ne.). Pokud nyní opravíme hladinu významnosti pomocí Bonferroni na 0,05 / 5 = 0,01. Můžeme numericky odhadnout výslednou Pravou kladnou frekvenci (citlivost / sílu) a Pravdu Negativní míra (specificita)?

Mnohokrát děkujeme za vaši pomoc.

Odpověď

$ \ alpha $ a $ \ beta $ spolu souvisejí. Pokusím se ilustrovat bod diagnostickým testem. Řekněme, že máte diagnostický test, který měří hladinu krevního markeru. Je známo, že lidé s určitým onemocněním mají nižší hladinu tohoto markeru ve srovnání se zdravými lidmi. Je okamžitě jasné, že musíte rozhodnout o mezní hodnotě hodnota, pod níž je člověk klasifikován jako „nemocný“, zatímco lidé s hodnotami nad touto mezní hodnotou jsou považováni za zdravé. Je však velmi pravděpodobné, že distribuce krevního markeru se značně liší dokonce i u nemocných a zdraví lidé. Někteří zdraví lidé mohou mít velmi nízké hladiny krevních markerů, i když jsou naprosto zdraví. A někteří nemocní lidé mají vysoké hladiny krevních markerů, i když mají tuto nemoc.

Existují čtyři možnosti, které mohou nastat:

  1. nemocná osoba je správně identifikována jako nemocná (true positive = TP)
  2. nemocná osoba je falešně klasifikována jako zdravá (false positive = FN)
  3. zdravý člověk je správně označen jako zdravý (true negative = TN)
  4. zdravý člověk je falešně klasifikován jako nemocný (false positive = FP)

Tyto možnosti lze ilustrovat pomocí tabulky 2×2 :

 Sick Healthy Test positive TP FP Test negative FN TN 

$ \ alpha $ označuje míru falešně pozitivních výsledků, což je $ \ alpha = FP / (FP + TN) $. $ \ beta $ je míra falešně negativních výsledků, což je $ \ beta = FN / (TP + FN) $. Napsal jsem jednoduše R skript, který graficky ilustruje situaci.

alphabeta <- function(mean.sick=100, sd.sick=10, mean.healthy=130, sd.healthy=10, cutoff=120, n=10000, side="below", do.plot=TRUE) { popsick <- rnorm(n, mean=mean.sick, sd=sd.sick) pophealthy <- rnorm(n, mean=mean.healthy, sd=sd.healthy) if ( side == "below" ) { truepos <- length(popsick[popsick <= cutoff]) falsepos <- length(pophealthy[pophealthy <= cutoff]) trueneg <- length(pophealthy[pophealthy > cutoff]) falseneg <- length(popsick[popsick > cutoff]) } else if ( side == "above" ) { truepos <- length(popsick[popsick >= cutoff]) falsepos <- length(pophealthy[pophealthy >= cutoff]) trueneg <- length(pophealthy[pophealthy < cutoff]) falseneg <- length(popsick[popsick < cutoff]) } twotable <- matrix(c(truepos, falsepos, falseneg, trueneg), 2, 2, byrow=T) rownames(twotable) <- c("Test positive", "Test negative") colnames(twotable) <- c("Sick", "Healthy") spec <- twotable[2,2]/(twotable[2,2] + twotable[1,2]) alpha <- 1 - spec sens <- pow <- twotable[1,1]/(twotable[1,1] + twotable[2,1]) beta <- 1 - sens pos.pred <- twotable[1,1]/(twotable[1,1] + twotable[1,2]) neg.pred <- twotable[2,2]/(twotable[2,2] + twotable[2,1]) if ( do.plot == TRUE ) { dsick <- density(popsick) dhealthy <- density(pophealthy) par(mar=c(5.5, 4, 0.5, 0.5)) plot(range(c(dsick$x, dhealthy$x)), range(c(c(dsick$y, dhealthy$y))), type = "n", xlab="", ylab="", axes=FALSE) box() axis(1, at=mean(pophealthy), lab=substitute(mu[H[0]]~paste("=",m, sep=""), list(m=mean.healthy)), cex.axis=1.5,tck=0.02) axis(1, at=mean(popsick), lab=substitute(mu[H[1]]~paste("=",m, sep=""), list(m=mean.sick)), cex.axis=1.5, tck=0.02) axis(1, at=cutoff, lab=substitute(italic(paste("Cutoff=",coff, sep="")), list(coff=cutoff)), pos=-0.004, tick=FALSE, cex.axis=1.25) lines(dhealthy, col = "steelblue", lwd=2) if ( side == "below" ) { polygon(c(cutoff, dhealthy$x[dhealthy$x<=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x<=cutoff],0), col = "grey65") } else if ( side == "above" ) { polygon(c(cutoff, dhealthy$x[dhealthy$x>=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x>=cutoff],0), col = "grey65") } lines(dsick, col = "red", lwd=2) if ( side == "below" ) { polygon(c(cutoff,dsick$x[dsick$x>cutoff],cutoff),c(0,dsick$y[dsick$x>cutoff],0) , col="grey90") } else if ( side == "above" ) { polygon(c(cutoff,dsick$x[dsick$x<=cutoff],cutoff),c(0,dsick$y[dsick$x<=cutoff],0) , col="grey90") } legend("topleft", legend=(c(as.expression(substitute(alpha~paste("=", a), list(a=round(alpha,3)))), as.expression(substitute(beta~paste("=", b), list(b=round(beta,3)))))), fill=c("grey65", "grey90"), cex=1.2, bty="n") abline(v=mean(popsick), lty=3) abline(v=mean(pophealthy), lty=3) abline(v=cutoff, lty=1, lwd=1.5) abline(h=0) } #list(specificity=spec, sensitivity=sens, alpha=alpha, beta=beta, power=pow, positiv.predictive=pos.pred, negative.predictive=neg.pred) c(alpha, beta) } 

Pojďme se podívat na příklad. Předpokládáme, že průměrná hladina krevního markeru u nemocných je 100 se standardní odchylkou 10. U zdravých lidí je průměrná hladina v krvi 140 se standardní odchylkou 15. Lékař stanoví mezní hodnotu na 120.

alphabeta(mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, cutoff=120, n=100000, do.plot=TRUE, side="below") Sick Healthy Test positive 9764 901 Test negative 236 9099 

Beta a alfa s mezní hodnotou 120

Vidíte, že stínované oblasti jsou ve vzájemném vztahu. V tomto případě $ \ alpha = 901 / (901+ 9099) \ přibližně 0,09 $ a $ \ beta = 236 / (236 + 9764) \ přibližně 0,024 $. Co se však stane, když klinik nastavil omezení jinak? Pojďme jej nastavit o něco níže na 105 a uvidíme, co se stane.

 Sick Healthy Test positive 6909 90 Test negative 3091 9910 

Mezní hodnota 105

Naše $ \ alpha $ je nyní velmi nízké, protože téměř žádný zdravý člověk není diagnostikován jako nemocný. Ale naše $ \ beta $ se zvýšilo, protože nemocní lidé s vysokou úrovní krevních markerů jsou nyní falešně klasifikováni jako zdraví.

Nakonec se podívejme, jak se $ \ alpha $ a $ \ beta $ mění pro různé mezní hodnoty:

cutoffs <- seq(0, 200, by=0.1) cutoff.grid <- expand.grid(cutoffs) plot.frame <- apply(cutoff.grid, MARGIN=1, FUN=alphabeta, mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, n=100000, do.plot=FALSE, side="below") plot(plot.frame[1,]~cutoffs, type="l", las=1, xlab="Cutoff value", ylab="Alpha/Beta", lwd=2, cex.axis=1.5, cex.lab=1.2) lines(plot.frame[2,]~cutoffs, col="steelblue", lty=2, lwd=2) legend("topleft", legend=c(expression(alpha), expression(beta)), lwd=c(2,2),lty=c(1,2), col=c("black", "steelblue"), bty="n", cex=1.2) 

Graf alfa a beta s různými mezními hodnotami

Vy okamžitě vidí, že poměr $ \ alpha $ a $ \ beta $ není konstantní. Velmi důležitá je také velikost efektu. V tomto případě by se jednalo o rozdíl průměrů hladin krevních markerů mezi nemocnými a zdravými lidmi. Čím větší je rozdíl, tím snadněji lze obě skupiny oddělit mezní hodnotou:

Dokonalá mezní hodnota

Zde máme “ perfektní „test v tom smyslu, že hranice 150 diskriminuje nemocné a zdravé.


Bonferroniho úpravy

Úpravy Bonferroni snižují chybu $ \ alpha $, ale nafukují chybu typu II ($ \ beta $) .To znamená, že chyba při vytváření falešně negativního rozhodnutí se zvyšuje, zatímco falešně pozitivní výsledky jsou minimalizovány. Proto je úprava Bonferroni často nazývána konzervativní. Ve výše uvedených grafech si povšimněte, jak se $ \ beta $ zvýšil, když jsme snížili mezní hodnotu ze 120 na 105: vzrostla z 0,02 $ na 0,31 $. Současně $ \ alpha $ se snížil z 0,09 $ na 0,01 $.

Komentáře

  • @COOLSerdash Wow pěkná odpověď! Děkuji. Ve vašem příkladu je volba významnou úroveň lze provést u známých distribucí. Například v biologii nemůžete znát distribuci vaší závislé proměnné, pokud má léčba účinek. Jinými slovy, výběrem úrovně významnosti zvolíte Falešně pozitivní frekvenci, ale nemáte téměř žádnou představu jak je nastavena míra falešných negativů. Protože ve skutečnosti nemáte představu o tom, jak jsou nastaveny skutečné pozitivní a negativní sazby. Je to správné?
  • @ Remi.b Díky. Myslím, že máte pravdu. Obvykle jednoduše si vyberete $ \ alpha $ jako hladinu významnosti nebo provedete výpočet výkonu dříve (vytvořením předpokladů o velikosti efektu, $ \ alpha $ a energie ($ 1- \ beta $). Ale máte ' pravdu: výběrem můžete $ \ alpha $ ovládat, ale $ \ beta $ je často neznámý. Tento dokument je velmi dobrým výchozím bodem k hodnotám $ p $ a tomu, co skutečně znamenají úrovně $ \ alpha $.

Odpověď

Pro ostatní v budoucnu:

V odhadu velikosti vzorku se Ztotal vypočítá přidáním Z odpovídající alfa a Z odpovídající výkonu (1-beta). Matematicky, pokud je velikost vzorku udržována konstantní, zvýšení Z pro alfa znamená, že snížíte Z pro sílu o STEJNÉ množství, např. Zvýšení Zalpha z 0,05 na 0,1 sníží Zpower o 0,05.

Rozdíl je v Z pro alfa je dvoustranný, zatímco Z pro beta je jednostranný. Takže zatímco se hodnota Z mění o stejnou částku, ale pravděpodobnost%, kterému tato hodnota Z odpovídá, se nemění o stejnou částku.

Příklad:

5% alfa ( 95% spolehlivost) s 80% výkonem (20% beta) dává stejnou velikost vzorku jako

20% alfa (80% spolehlivost) s 93,6% výkonem (6,4% beta), spíše než 95% výkon by měl, kdyby vztah byl 1: 1.

Odpověď

Mezi alfa a beta neexistuje obecný vztah.

Vše záleží na vašem testu, vezměte jednoduchý příklad:

(Wikipedia)

V hovorovém typu použití lze chybu I považovat za „usvědčování nevinné osoby“ a chyba typu II „nechat vinného člověka osvobodit“.

Porota může být přísná: žádná chyba typu II, některá porota typu IA může být „milá“: žádný typ I, ale některá porota typu II A může být normální: některé typy I a jiné typu II Porota může být dokonalá: žádná chyba

V praxi existují dva protichůdné účinky:

Když se zvýší kvalita testu, t Chyba ype I a typu II se do určité míry snižuje. Když se porota zlepší, má tendenci vydávat lepší úsudek nad nevinnými i vinnými lidmi.

Po určitém okamžiku se při sestavování testu objeví základní problém. Typ I nebo II jsou důležitější pro toho, kdo test provede. S příkladem poroty jsou chyby typu I důležitější, a proto je právní proces budován tak, aby se zabránilo typu I. V případě pochybností je osoba svobodná. Intuitivně to vedlo k nárůstu chyby typu II.

Pokud jde o Bonferroni:

(opět Wikipedia)

Korekce Bonferroni kontroluje pravděpodobnost pouze falešných poplachů. Oprava obvykle přichází za cenu zvýšení pravděpodobnosti vzniku falešných negativů a následného snížení statistické síly. Při testování velkého počtu hypotéz to může vést k velkým kritickým hodnotám.

Komentáře

  • Díky za vaši odpověď, Je to užitečné, ale přesto něco není mi jasné. Aktualizoval jsem svůj příspěvek přidáním nové otázky.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *