Statisztika: Az alfa és a béta kapcsolata

A kérdésem az alfa és a béta kapcsolatához, valamint azok statisztikai meghatározásaihoz kapcsolódik.

alfa = I. típusú hibaarány = szignifikancia szint, figyelembe véve, hogy a NULL hipotézis helyes-e

Beta = II-es típusú hibaarány

Ha az alfa alacsonyabb (a specifitás növekszik, ha az alfa = 1 – specifitás ), a béta növekszik (az érzékenység / teljesítmény csökken, mivel a béta = 1 – érzékenység / teljesítmény)

Hogyan befolyásolja az alfa változása a bétát? Van-e lineáris összefüggés vagy sem? Az alfa / béta arány mindig ugyanaz, más szóval az arányspecifitás / érzékenység mindig ugyanaz? Ha igen, ez azt jelenti, hogy egy bonferroni korrekció alkalmazásával csak alacsonyabb érzékenységre és magasabb specifitásra térünk át, de nem változtatjuk meg az érzékenység / specificitás arányt. Helyes ezt mondani?

Frissítés (esetspecifikus kérdés):

Egy adott kísérleti tervezéshez 5 Lineáris modellt futtatunk az adatokon. Valódi pozitív arány (érzékenység / teljesítmény) 0,8, valódi negatív arány (specifitás) 0,7. (Képzeljük el, hogy tudjuk, mi legyen pozitív és mi ne.). Ha a Bonferroni segítségével a szignifikancia szintet korrigáljuk 0,05 / 5 = 0,01 értékre. Meg tudjuk-e számszerűen megbecsülni az eredményül kapott pozitív pozitív arányt (érzékenység / teljesítmény) és az igaz értéket Negatív arány (specifikusság)?

Nagyon köszönöm a segítséget.

Válasz

$ \ alpha A $ és a $ \ beta $ összefüggenek. Megpróbálom egy diagnosztikai teszttel illusztrálni a lényeget. Mondjuk, hogy van egy diagnosztikai teszted, amely méri a vérmarker szintjét. Ismert, hogy egy bizonyos betegségben szenvedőknél alacsonyabb ez a marker, mint az egészséges embereknél. Egyből világos, hogy el kell döntened a határértéket érték, amely alatt egy személyt “betegnek” minősítenek, míg az emberek, akiknek értéke meghaladja ezt a határértéket, egészségesnek gondolják. Nagyon valószínű azonban, hogy a vérmarker megoszlása még belül is betegeken jelentősen eltér és egészséges emberek. Néhány egészséges embernek nagyon alacsony a vérmarkere, annak ellenére, hogy tökéletesen egészséges. És néhány betegnek magas a vérmarkere, annak ellenére, hogy betegségben szenvednek.

Négy van Lehetséges esetek:

egy beteg személyt helyesen betegként azonosítanak (igaz pozitív = TP)

egy beteget hamisan egészségesnek minősítenek (hamis negatív = FN)

az egészséges embert helyesen azonosítják egészségesnek (igaz negatív = TN)

egy egészséges embert hamisan betegnek minősítenek (hamis pozitív = FP)

Ezeket a lehetőségeket egy 2×2 táblával :

Sick Healthy Test positive TP FP Test negative FN TN

$ \ alpha $ a hamis pozitív arányt jelöli, amely $ \ alpha = FP / (FP + TN) $. A $ \ beta $ a hamis negatív arány, amely $ \ beta = FN / (TP + FN) $. A helyzet grafikus ábrázolásához egyszerűen R szkriptet írtam.

alphabeta <- function(mean.sick=100, sd.sick=10, mean.healthy=130, sd.healthy=10, cutoff=120, n=10000, side="below", do.plot=TRUE) { popsick <- rnorm(n, mean=mean.sick, sd=sd.sick) pophealthy <- rnorm(n, mean=mean.healthy, sd=sd.healthy) if ( side == "below" ) { truepos <- length(popsick[popsick <= cutoff]) falsepos <- length(pophealthy[pophealthy <= cutoff]) trueneg <- length(pophealthy[pophealthy > cutoff]) falseneg <- length(popsick[popsick > cutoff]) } else if ( side == "above" ) { truepos <- length(popsick[popsick >= cutoff]) falsepos <- length(pophealthy[pophealthy >= cutoff]) trueneg <- length(pophealthy[pophealthy < cutoff]) falseneg <- length(popsick[popsick < cutoff]) } twotable <- matrix(c(truepos, falsepos, falseneg, trueneg), 2, 2, byrow=T) rownames(twotable) <- c("Test positive", "Test negative") colnames(twotable) <- c("Sick", "Healthy") spec <- twotable[2,2]/(twotable[2,2] + twotable[1,2]) alpha <- 1 - spec sens <- pow <- twotable[1,1]/(twotable[1,1] + twotable[2,1]) beta <- 1 - sens pos.pred <- twotable[1,1]/(twotable[1,1] + twotable[1,2]) neg.pred <- twotable[2,2]/(twotable[2,2] + twotable[2,1]) if ( do.plot == TRUE ) { dsick <- density(popsick) dhealthy <- density(pophealthy) par(mar=c(5.5, 4, 0.5, 0.5)) plot(range(c(dsick$x, dhealthy$x)), range(c(c(dsick$y, dhealthy$y))), type = "n", xlab="", ylab="", axes=FALSE) box() axis(1, at=mean(pophealthy), lab=substitute(mu[H[0]]~paste("=",m, sep=""), list(m=mean.healthy)), cex.axis=1.5,tck=0.02) axis(1, at=mean(popsick), lab=substitute(mu[H[1]]~paste("=",m, sep=""), list(m=mean.sick)), cex.axis=1.5, tck=0.02) axis(1, at=cutoff, lab=substitute(italic(paste("Cutoff=",coff, sep="")), list(coff=cutoff)), pos=-0.004, tick=FALSE, cex.axis=1.25) lines(dhealthy, col = "steelblue", lwd=2) if ( side == "below" ) { polygon(c(cutoff, dhealthy$x[dhealthy$x<=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x<=cutoff],0), col = "grey65") } else if ( side == "above" ) { polygon(c(cutoff, dhealthy$x[dhealthy$x>=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x>=cutoff],0), col = "grey65") } lines(dsick, col = "red", lwd=2) if ( side == "below" ) { polygon(c(cutoff,dsick$x[dsick$x>cutoff],cutoff),c(0,dsick$y[dsick$x>cutoff],0) , col="grey90") } else if ( side == "above" ) { polygon(c(cutoff,dsick$x[dsick$x<=cutoff],cutoff),c(0,dsick$y[dsick$x<=cutoff],0) , col="grey90") } legend("topleft", legend=(c(as.expression(substitute(alpha~paste("=", a), list(a=round(alpha,3)))), as.expression(substitute(beta~paste("=", b), list(b=round(beta,3)))))), fill=c("grey65", "grey90"), cex=1.2, bty="n") abline(v=mean(popsick), lty=3) abline(v=mean(pophealthy), lty=3) abline(v=cutoff, lty=1, lwd=1.5) abline(h=0) } #list(specificity=spec, sensitivity=sens, alpha=alpha, beta=beta, power=pow, positiv.predictive=pos.pred, negative.predictive=neg.pred) c(alpha, beta) }

Nézzünk meg egy példát. Feltételezzük, hogy a beteg vérében a vérjelző átlagos szintje 100, szórása 10. Az egészséges emberek körében az átlagos vérszint 140, standard szórással 15. A klinikus 120-as határértéket állít be. / p>

alphabeta(mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, cutoff=120, n=100000, do.plot=TRUE, side="below") Sick Healthy Test positive 9764 901 Test negative 236 9099

Látja, hogy az árnyékolt a területek kapcsolatban vannak egymással. Ebben az esetben $ \ alpha = 901 / (901+ 9099) \ kb. 0,09 $ és $ \ beta = 236 / (236 + 9764) \ kb. 0,024 $. De mi történik, ha a klinikus másképp állította be a határértéket? Állítsuk be egy kicsit alacsonyabbra, 105-re, és nézzük meg, mi történik.

Sick Healthy Test positive 6909 90 Test negative 3091 9910

A $ \ alpha $ értéke nagyon alacsony, mert szinte egyetlen egészséges embert sem diagnosztizálnak betegnek. De a $ \ beta $ értéke növekedett, mert a magas vérmarkerekkel rendelkező betegeket hamisan egészségesnek minősítik.

Végül nézzük meg, hogyan változik a $ \ alpha $ és a $ \ beta $ a különböző cutoffs:

cutoffs <- seq(0, 200, by=0.1) cutoff.grid <- expand.grid(cutoffs) plot.frame <- apply(cutoff.grid, MARGIN=1, FUN=alphabeta, mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, n=100000, do.plot=FALSE, side="below") plot(plot.frame[1,]~cutoffs, type="l", las=1, xlab="Cutoff value", ylab="Alpha/Beta", lwd=2, cex.axis=1.5, cex.lab=1.2) lines(plot.frame[2,]~cutoffs, col="steelblue", lty=2, lwd=2) legend("topleft", legend=c(expression(alpha), expression(beta)), lwd=c(2,2),lty=c(1,2), col=c("black", "steelblue"), bty="n", cex=1.2)

Ön azonnal láthatja, hogy a $ \ alpha $ és a $ \ beta $ arány nem állandó. Ami szintén nagyon fontos, az a hatás nagysága. Ebben az esetben ez lenne a különbség a vérmarkerek szintjének átlagában a betegek és az egészséges emberek körében. Minél nagyobb a különbség, annál könnyebben lehet elválasztani a két csoportot egy elvágással:

Itt van egy “” tökéletes “teszt abban az értelemben, hogy a 150-es határérték megkülönbözteti a betegeket az egészségesektől.

Bonferroni beállítások

A Bonferroni-beállítások csökkentik a $ \ alpha $ hibát, de felfújják a II-es típusú hibát ($ \ beta $) .Ez azt jelenti, hogy a hamis negatív döntés meghozatalának hibája nő, miközben a hamis pozitív eredményeket minimalizálják. Ezért nevezik a Bonferroni-kiigazítást gyakran konzervatívnak. A fenti grafikonokon vegye figyelembe, hogy a $ \ beta $ hogyan nőtt, amikor 120-ról 105-re csökkentettük a határértéket: 0,02 $ -ról 0,31 $ -ra nőtt. Ugyanakkor, $ Az \ alpha $ 0,09 $ -ról 0,01 $ -ra csökkent.

Hozzászólások

@COOLSerdash Wow szép válasz! Köszönöm. Példájában a jelentős szintet lehet megtenni ismert eloszlásokon. A biológiában például nem lehet tudni a függő változó eloszlását, ha a kezelésnek van hatása. Vagyis a szignifikancia szint kiválasztásával a hamis pozitív arányt választja, de szinte fogalma sincs hogyan állítják be a hamis negatív arányt. Mivel valójában fogalmad sincs arról, hogyan állítsák be az igaz pozitív és negatív arányokat. Ez helyes?

@ Remi.b köszönöm. Szerintem igazad van. Általában csak a $ \ alpha $ értéket választja szignifikancia szintnek, vagy korábban elvégez egy teljesítményszámítást (feltételezésekkel a hatás nagyságáról, $ \ alpha $ a második teljesítmény ($ 1- \ beta $). De ' igazad van: a $ \ alpha $ vezérlésével választhatod, de a $ \ beta $ gyakran ismeretlen. Ez a cikk nagyon jó kiindulópont a $ p $ -értékekről és arról, hogy mit is jelentenek a $ \ alpha $ szintek.

Válasz

Mások számára a jövőben:

A minta méretének becslésében a Zösszeget az alfának megfelelő Z összeadásával számítják ki és Z, amely megfelel a teljesítménynek (1-béta). Tehát matematikailag, ha a minta méretét állandó értéken tartjuk, akkor az alfa esetén a Z növelése azt jelenti, hogy a teljesítmény Z értékét SAME összeggel csökkenti, például ha a Zalpha értékét 0,05-ről 0,1-re növeljük, akkor a Zpower értéke 0,05-tel csökken.

A különbség a Z mert az alfa kétfarkú, míg a béta Z értéke egyfarkú. Tehát, míg a Z érték ugyanannyival változik, de annak a valószínűsége, hogy% -a ennek a Z értéknek megfelel, nem változik ugyanolyan mértékben.

Példa:

5% alfa ( 95% -os megbízhatóság) 80% -os teljesítménnyel (20% béta) ugyanolyan mintaméretet ad, mint a

20% alfa (80% -os megbízhatóság) 93,6% -os teljesítménnyel (6,4% béta), nem pedig a 95% -os akkor lenne, ha a kapcsolat 1: 1 lenne.

Válasz

Az alfa és a béta között nincs általános kapcsolat.

Minden a teszten múlik, vegye az egyszerű példát:

(Wikipédia)

Az I. típusú köznyelvi használatban a hibát úgy lehet elképzelni, mint “ártatlan ember elítélését”. és a II. típusú hiba “a bűnös ember szabadon engedése”.

Az esküdtszék súlyos lehet: nincs II. típusú hiba, egyes IA típusú zsűri “kedves” lehet: nincs I. típusú, de van néhány II A típusú zsűri. normális lehet: néhány I. típusú és II. típusú A zsűri tökéletes lehet: nincs hiba

A gyakorlatban két antagonista hatás van:

Ha a teszt minősége megnő, t az ype I és II típusú hiba bizonyos pontig csökken. Amikor az esküdtszék javul, hajlamosabb megítélni mind az ártatlan, mind a bűnös embereket.

Egy bizonyos idő után az alapprobléma megjelenik a teszt felépítésében. Az I. vagy a II. Típus fontosabb annak, aki futtatja a tesztet. Az esküdtszék példájával az I. típusú hibák fontosabbak, ezért a jogi eljárás az I. típus elkerülésére épül. Ha kétség merül fel, az illető szabad. Ez intuitív módon a II. Típusú hibák növekedéséhez vezet.

Bonferroni:

(ismét Wikipédia)

A Bonferroni korrekció csak a hamis pozitív eredmények valószínűségét szabályozza. A korrekció általában azzal a költséggel jár, hogy növeli a hamis negatívok előállításának valószínűségét, és ennek következtében csökken a statisztikai teljesítmény. Nagyszámú hipotézis tesztelésekor ez nagy kritikus értékeket eredményezhet.

Megjegyzések

Köszönöm válaszát, Hasznos, de mégis valami számomra nem világos. Frissítettem a bejegyzésemet egy új kérdéssel.

Válasz

Hozzászólások

Válasz

Válasz

Megjegyzések

Vélemény, hozzászólás? Kilépés a válaszból