Tilastot: Alfan ja Beetan välinen suhde

Kysymykseni liittyy alfa- ja beeta-suhteisiin sekä niiden määritelmiin tilastoissa.

alfa = tyypin I virhesuhde = merkitsevyystaso tarkasteltaessa, että NULL-hypoteesi on oikea

Beta = tyypin II virhesuhde

Jos alfa lasketaan (spesifisyys kasvaa alfa = 1 – spesifisyys ), beeta kasvaa (herkkyys / teho pienenee, kun beeta = 1 – herkkyys / teho)

Kuinka alfamuutos vaikuttaa beetaan? Onko lineaarinen suhde vai ei? Onko alfa / beeta-suhde aina sama, toisin sanoen suhdespesifisyys / herkkyys on aina sama? Jos kyllä, se tarkoittaa, että käyttämällä bonferroni-korjausta ”siirrymme vain pienemmälle herkkyydelle ja korkeammalle spesifisyydelle, mutta emme muutta herkkyys / spesifisyyden suhdetta. Onko oikein sanoa niin?

Päivitys (tapauskohtainen kysymys):

Annamme tietylle kokeelliselle suunnittelulle 5 lineaarista mallia. Todellinen positiivinen osuus (herkkyys / teho) on 0,8 ja todellinen negatiivinen nopeus (spesifisyys) 0,7. (Kuvitelkaamme, että tiedämme, minkä pitäisi olla positiivista ja minkä ei.). Jos korjaamme nyt merkitsevyystason Bonferronilla arvoon 0,05 / 5 = 0,01. Voimmeko numeerisesti arvioida tuloksena olevan todellisen positiivisen määrän (herkkyys / teho) ja tosi Negatiivisuus (tarkkuus)?

Kiitos paljon avusta.

Vastaa

$ \ alfa $ ja $ \ beta $ liittyvät toisiinsa. Yritän havainnollistaa asiaa diagnostiikkatestillä. Sanotaan, että sinulla on diagnostinen testi, joka mittaa verimerkin tasoa. Tiedetään, että tietyn sairauden omaavilla ihmisillä on tätä merkkiainetta matalampi kuin terveillä ihmisillä. On heti selvää, että sinun on päätettävä raja-arvosta arvo, jonka alapuolella henkilö luokitellaan ”sairaaksi”, kun taas ihmisten, joiden arvot ylittävät tämän raja-arvon, uskotaan olevan terveitä. On kuitenkin hyvin todennäköistä, että verimerkin jakauma vaihtelee huomattavasti jopa sairaiden sisällä ja terveillä ihmisillä. Joillakin terveillä ihmisillä saattaa olla hyvin alhainen verimerkkitaso, vaikka ne olisivatkin täysin terveitä. Ja joillakin sairailla ihmisillä on korkea veren merkkiaine, vaikka heillä on sairaus.

On olemassa neljä Mahdollisuudet, joita voi esiintyä:

sairas henkilö on oikein tunnistettu sairaana (tosi positiivinen = TP)
sairas henkilö luokitellaan väärin terveeksi (väärä negatiivinen = FN)
terveellinen henkilö tunnistetaan oikein terveeksi (tosi negatiivinen = TN)
terveellinen henkilö luokitellaan väärin sairaana (väärä positiivinen = FP)

Nämä mahdollisuudet voidaan havainnollistaa 2×2 -taulukolla :

 Sick Healthy Test positive TP FP Test negative FN TN

$ \ alpha $ tarkoittaa väärän positiivisen osuutta, joka on $ \ alpha = FP / (FP + TN) $. $ \ beta $ on väärä negatiivinen prosenttiosuus, joka on $ \ beta = FN / (TP + FN) $. Kirjoitin yksinkertaisesti R komentosarjan havainnollistaakseni tilannetta graafisesti.

alphabeta <- function(mean.sick=100, sd.sick=10, mean.healthy=130, sd.healthy=10, cutoff=120, n=10000, side="below", do.plot=TRUE) { popsick <- rnorm(n, mean=mean.sick, sd=sd.sick) pophealthy <- rnorm(n, mean=mean.healthy, sd=sd.healthy) if ( side == "below" ) { truepos <- length(popsick[popsick <= cutoff]) falsepos <- length(pophealthy[pophealthy <= cutoff]) trueneg <- length(pophealthy[pophealthy > cutoff]) falseneg <- length(popsick[popsick > cutoff]) } else if ( side == "above" ) { truepos <- length(popsick[popsick >= cutoff]) falsepos <- length(pophealthy[pophealthy >= cutoff]) trueneg <- length(pophealthy[pophealthy < cutoff]) falseneg <- length(popsick[popsick < cutoff]) } twotable <- matrix(c(truepos, falsepos, falseneg, trueneg), 2, 2, byrow=T) rownames(twotable) <- c("Test positive", "Test negative") colnames(twotable) <- c("Sick", "Healthy") spec <- twotable[2,2]/(twotable[2,2] + twotable[1,2]) alpha <- 1 - spec sens <- pow <- twotable[1,1]/(twotable[1,1] + twotable[2,1]) beta <- 1 - sens pos.pred <- twotable[1,1]/(twotable[1,1] + twotable[1,2]) neg.pred <- twotable[2,2]/(twotable[2,2] + twotable[2,1]) if ( do.plot == TRUE ) { dsick <- density(popsick) dhealthy <- density(pophealthy) par(mar=c(5.5, 4, 0.5, 0.5)) plot(range(c(dsick$x, dhealthy$x)), range(c(c(dsick$y, dhealthy$y))), type = "n", xlab="", ylab="", axes=FALSE) box() axis(1, at=mean(pophealthy), lab=substitute(mu[H[0]]~paste("=",m, sep=""), list(m=mean.healthy)), cex.axis=1.5,tck=0.02) axis(1, at=mean(popsick), lab=substitute(mu[H[1]]~paste("=",m, sep=""), list(m=mean.sick)), cex.axis=1.5, tck=0.02) axis(1, at=cutoff, lab=substitute(italic(paste("Cutoff=",coff, sep="")), list(coff=cutoff)), pos=-0.004, tick=FALSE, cex.axis=1.25) lines(dhealthy, col = "steelblue", lwd=2) if ( side == "below" ) { polygon(c(cutoff, dhealthy$x[dhealthy$x<=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x<=cutoff],0), col = "grey65") } else if ( side == "above" ) { polygon(c(cutoff, dhealthy$x[dhealthy$x>=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x>=cutoff],0), col = "grey65") } lines(dsick, col = "red", lwd=2) if ( side == "below" ) { polygon(c(cutoff,dsick$x[dsick$x>cutoff],cutoff),c(0,dsick$y[dsick$x>cutoff],0) , col="grey90") } else if ( side == "above" ) { polygon(c(cutoff,dsick$x[dsick$x<=cutoff],cutoff),c(0,dsick$y[dsick$x<=cutoff],0) , col="grey90") } legend("topleft", legend=(c(as.expression(substitute(alpha~paste("=", a), list(a=round(alpha,3)))), as.expression(substitute(beta~paste("=", b), list(b=round(beta,3)))))), fill=c("grey65", "grey90"), cex=1.2, bty="n") abline(v=mean(popsick), lty=3) abline(v=mean(pophealthy), lty=3) abline(v=cutoff, lty=1, lwd=1.5) abline(h=0) } #list(specificity=spec, sensitivity=sens, alpha=alpha, beta=beta, power=pow, positiv.predictive=pos.pred, negative.predictive=neg.pred) c(alpha, beta) }

Katsotaanpa esimerkkiä. Oletetaan, että sairaiden ihmisten verimerkkitason keskiarvo on 100 ja keskihajonta 10. Terveiden ihmisten keskimääräinen veren taso on 140 ja keskihajonta 15. Kliinikko asettaa raja-arvon 120.

alphabeta(mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, cutoff=120, n=100000, do.plot=TRUE, side="below") Sick Healthy Test positive 9764 901 Test negative 236 9099

Beeta ja alfa, joiden raja-arvo on 120

Näet, että varjostettu alueet ovat suhteessa toisiinsa. Tässä tapauksessa $ \ alpha = 901 / (901+ 9099) \ noin 0,09 $ ja $ \ beta = 236 / (236 + 9764) \ noin 0,024 $. Mutta mitä tapahtuu, jos lääkäri oli asettanut raja-arvon eri tavalla? Annetaan sen asettaa hieman pienemmäksi arvoksi 105 ja nähdä, mitä tapahtuu.

 Sick Healthy Test positive 6909 90 Test negative 3091 9910

Katkaisu 105

$ \ alfa $ on nyt hyvin alhainen, koska melkein yhtään terveellistä ihmistä ei ole diagnosoitu sairaaksi. Mutta $ \ beta $ on kasvanut, koska sairaat ihmiset, joilla on korkea verimerkkitaso, luokitellaan nyt väärin terveiksi.

Katsotaanpa lopuksi, kuinka $ \ alpha $ ja $ \ beta $ muuttuvat eri raja-arvot:

cutoffs <- seq(0, 200, by=0.1) cutoff.grid <- expand.grid(cutoffs) plot.frame <- apply(cutoff.grid, MARGIN=1, FUN=alphabeta, mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, n=100000, do.plot=FALSE, side="below") plot(plot.frame[1,]~cutoffs, type="l", las=1, xlab="Cutoff value", ylab="Alpha/Beta", lwd=2, cex.axis=1.5, cex.lab=1.2) lines(plot.frame[2,]~cutoffs, col="steelblue", lty=2, lwd=2) legend("topleft", legend=c(expression(alpha), expression(beta)), lwd=c(2,2),lty=c(1,2), col=c("black", "steelblue"), bty="n", cex=1.2)

Alfa- ja beetapiirros, joilla on erilaiset raja-arvot

Sinä voi heti nähdä, että $ \ alpha $: n ja $ \ beta $ -suhde ei ole vakio. Mikä on myös erittäin tärkeää, on vaikutuksen koko. Tässä tapauksessa tämä olisi ero verimerkkitasojen keskiarvosta sairaiden ja terveiden ihmisten keskuudessa. Mitä suurempi ero, sitä helpommin nämä kaksi ryhmää voidaan erottaa raja-arvolla:

Täydellinen katkaisu

Tässä meillä on ” täydellinen ”testi siinä mielessä, että 150: n raja-arvo erottaa sairaat terveistä.

Bonferroni-säätö

Bonferroni-säätö vähentää $ \ alpha $ -virhettä, mutta lisää tyypin II virheen ($ \ beta $) .Tämä tarkoittaa, että virheellisen negatiivisen päätöksen tekemisen virhe lisääntyy, kun taas väärät positiiviset tulokset minimoidaan. Siksi Bonferroni-säätöä kutsutaan usein konservatiiviseksi. Huomaa yllä olevissa kaavioissa, kuinka $ \ beta $ kasvoi, kun alensimme raja-arvoa 120: stä 105: seen $ 0.02 $: sta $ 0.31 $. Samanaikaisesti $ \ alpha $ laski 0,09 dollarista 0,01 dollariin.

Kommentit

@COOLSerdash Vau vastaus! Kiitos. Esimerkissäsi valitsit merkittävä taso voidaan tehdä tunnetuilla jakaumilla. Esimerkiksi biologiassa et voi tietää riippuvaisen muuttujan jakaumaa, jos hoidolla on vaikutusta. Toisin sanoen valitsemalla merkitsevyystaso, valitset väärän positiivisen määrän, mutta sinulla ei ole juurikaan aavistustakaan. kuinka väärän negatiivisen prosenttiosuus asetetaan. Koska sinulla ei todellakaan ole aavistustakaan siitä, miten todelliset positiiviset ja negatiiviset hinnat asetetaan. Onko se oikein?
@ Remi.b Kiitos. Luulen, että olet oikeassa. Yleensä valitset vain merkitsevyystasoksi $ \ alpha $ tai teet teholaskelman ennen (tekemällä oletuksia vaikutuksen koosta, $ \ alpha $ a toinen teho ($ 1- \ beta $). Mutta olet ' oikeassa: voit hallita $ \ alpha $ valitsemalla se, mutta $ \ beta $ on usein tuntematon. Tämä artikkeli on erittäin hyvä lähtökohta $ p $ -arvoista ja siitä, mitä $ \ alfa $ -tasot todella tarkoittavat.

vastaus

Muille tulevaisuudessa:

Otoksen koon arvioinnissa Z-summa lasketaan lisäämällä alfaa vastaava Z ja Z vastaavat tehoa (1-beeta). Joten matemaattisesti, jos näytteen koko pidetään vakiona, Z: n lisääminen alfalle tarkoittaa, että pienennät Z: n tehoa SAMALLA määrällä, esim. Zalpha: n lisääminen 0,05: stä 0,1: een pienentää Zpoweria 0,05: lla.

Ero on Z alfa on kaksisuuntainen, kun taas beetan Z on 1-pyrstöinen. Joten, vaikka Z-arvo muuttuu samalla määrällä, mutta todennäköisyys%, jota tämä Z-arvo vastaa, ei muutu samalla määrällä.

Esimerkki:

5% alfa ( 95% luotettavuus) 80%: n teholla (20% beeta) antaa saman näytekoon kuin

20% alfa (80%: n luottamusväli) 93,6%: n teholla (6,4% beeta) sen sijaan, että 95%: n teho olisi, jos suhde olisi 1: 1.

Vastaus

Alfan ja beetan välillä ei ole yleistä suhdetta.

Kaikki riippuu testistäsi, ota yksinkertainen esimerkki:

(Wikipedia)

Keskusteluissa tyypin I virheen voidaan ajatella olevan ”syyttömän henkilön tuomitseminen” ja tyypin II virhe ”syyllisen vapauttaminen”.

Tuomaristo voi olla vakava: ei tyypin II virhettä, osa tyypin IA tuomaristo voi olla ”kiltti”: ei tyyppiä I, mutta tyyppiä II A: n tuomaristo voi olla normaali: jotkut tyypin I ja jotkut tyypin II A tuomaristot voivat olla täydellisiä: ei virheitä

Käytännössä on kaksi antagonistivaikutusta:

Kun testin laatu nousee, t ype I- ja type II -virheet pienenevät jossakin vaiheessa. Kun tuomaristo paranee, hän pyrkii antamaan paremman tuomion sekä viattomista että syyllisistä ihmisistä.

Jonkin ajan kuluttua taustalla oleva ongelma ilmenee testin rakentamisessa. Tyyppi I tai II ovat tärkeämpiä testiä suorittavalle. Tuomariston esimerkin mukaan tyypin I virheet ovat tärkeämpiä, joten lakiprosessi rakennetaan tyypin I välttämiseksi. Jos on epäilyksiä, henkilö on vapaa. Intuitiivisesti tämä johtaa tyypin II virheiden kasvuun.

Bonferroni:

(jälleen Wikipedia)

Bonferroni-korjaus ohjaa vain väärien positiivisuuksien todennäköisyyttä. Korjaus johtaa tavallisesti väärien negatiivien tuottamisen todennäköisyyden lisäämiseen ja siten tilastollisen tehon vähentämiseen. Testattaessa suurta määrää hypoteeseja tämä voi johtaa suuriin kriittisiin arvoihin.

Kommentit

Kiitos vastauksestasi, Se on hyödyllinen, mutta silti jotain ei ole minulle selvää. Päivitin viestini lisäämällä uuden kysymyksen.

Vastaa

Kommentit

vastaus

Vastaus

Kommentit

Vastaa Peruuta vastaus