Miksi korkea positiivinen kurtoosi on ongelmallinen hypoteesitesteissä?

Question

Olen kuullut (valitettavasti ei voi antaa linkkiä tekstiin, johon minulle on kerrottu), että jäännösten korkea positiivinen kurtoosi voi olla ongelmallista tarkkuuden saamiseksi hypoteesitestit ja luottamusvälit (ja siksi tilastollisen päättelyn ongelmat). Onko tämä totta ja jos on, miksi? Eikö jäännösten korkea positiivinen kurtoosi viittaa siihen, että suurin osa jäännöksistä on lähellä jäännöskeskiarvoa 0 ja siksi vähemmän suuria jäännöksiä on läsnä? (Jos sinulla on vastaus, yritä antaa vastaus, jossa ei ole paljon syvyysmatematiikkaa, koska en ole kovin matemaattisesti taipuvainen).

Kommentit

Oletan, että keskityt malleihin, joissa on ihanteelliset olosuhteet normaaleilla (Gaussin) virhetermeillä. (Monissa muissa yhteyksissä voidaan hyvin odottaa suurta jäännösten kurtoosia.) Korkea kurtoosi tarkoittaa todennäköisesti jakautumista, joka on normaalia raskaampi, joten jotkut erittäin korkeat (+ tai -) jäännökset. Vaikka lähellä nollaa onkin paljon, se on vain hyvä uutinen, ja mahdolliset huonot uutiset tarvitsevat huomiota. Mutta puolestaan se voi tarkoittaa mitä tahansa mitä tahansa. Jäännös vs. sovitettu juoni on yleensä informatiivisempi.
Keskityin todellakin malleihin, joissa on normaaliolettamuksia.

Answer 1

on kuullut […], että jäännösten korkea positiivinen kurtoosi voi olla ongelmallista tarkkojen hypoteesitestien ja luottamusvälien (ja siksi päättely). Onko tämä totta ja miksi?

Joissakin hypoteesitestissä se on totta.

Eikö korkea positiivinen jäännösten kurtoosi viittaa siihen, että suurin osa jäännöksistä on lähellä jäännöskeskiarvoa 0 ja siksi vähemmän suuria jäännöksiä on läsnä?

Ei .

Näyttää siltä, että sekoitat varianssin ja kurtoosin käsitteen. Jos varianssi olisi pienempi, niin taipumus enemmän pieniä jäännöksiä ja vähemmän suuria jäännöksiä tulisi yhteen. Kuvittele, että pidämme vakiopoikkeaman vakiona samalla kun muutamme kurtoosia (joten puhumme ehdottomasti muutoksista kurtoosiin eikä varianssiin).

Vertaa eri variansseja (mutta samaa kurtoosia):

eri kurtoosilla, mutta samalla varianssilla:

(kuvia div id = ”afbb5ca663”>

Answer 2

Kurtoosi mittaa poikkeavuuksia. Poikkeamat ovat ongelmallisia normaalijakaumalle perustuvien vakiopäätösten (esim. T-testit, t-aikavälit) suhteen. Se on tarinan loppu! Ja se on oikeastaan melko yksinkertainen tarina.

Syy, miksi tätä tarinaa ei arvosteta, johtuu siitä, että muinainen myytti siitä, että kurtosis mittaa ”huippua”, jatkuu.

Tässä on yksinkertainen selitys siitä, miksi kurtosis mittaa poikkeamia eikä ”huippua”.

Harkitse seuraavaa tietojoukkoa.

0, 3, 4, 1 , 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1

Kurtoosi on (z-arvojen) odotettu arvo ) ^ 4. Tässä ovat (z-arvot) ^ 4:

6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45

Keskiarvo on 2,78 ja se on arvio kurtoosista. (Vähennä 3, jos haluat ylimääräisen kurtoosin.)

Korvaa nyt viimeinen data-arvo 999: llä, jotta siitä tulee poikkeava:

0, 3, 4, 1, 2, 3 , 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999

Tässä ovat (z-arvot) ^ 4:

0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360, 98

Keskiarvo on 18,05, ja se on arvio kurtoosista. (Vähennä 3, jos haluat ylimääräisen kurtoosin.)

On selvää, että vain syrjäytymisillä on merkitystä. Mitään ”huippusta” tai keskellä olevista tiedoista ei ole merkitystä.

Jos teet tavanomaisia tilastollisia analyyseja toisen tietojoukon kanssa, sinun pitäisi odottaa ongelmia. Suuri kurtosis varoittaa sinua ongelmasta.

Tässä on artikkeli, joka käsittelee:

Westfall, P.H. (2014). Kurtosis kuin Peakedness, 1905 – 2014. R.I.P. American Statistician, 68, 191–195.

Kommentit

Miksi et käyttäisi vain ei-parametrisia testejä? Tämäntyyppisten ongelmien kohdalla ne ovat todennäköisesti parempia.
Hyväksytty, se on mahdollinen tapa, JOS pidät testauksesta, joka on nopeasti muuttumassa vähemmän mielenkiintoiseksi klassisessa muodossaan. Mutta se ei oikeastaan ole minun huoleni. Minua kiinnostaa enemmän todennäköisyyksien mallinnus yleensä. Yksi sovellus: Ehkä olet todella kiinnostunut keskiarvosta, esim. Tapauksissa, joissa riippuva muuttuja on ansaittuja dollareita, prosessin keskiarvo on mielenkiintoisempi kuin prosessin mediaani. Joten mitä tiedot kertovat prosessista, kun tiedot ovat alttiita ulkopuolelle? Se ’ on vaikea, mutta tärkeä ongelma, ja hetkellinen kurtoosi on merkityksellinen vastauksessa. Ei ei-ei-testit.
Cauchy-jakaumalle leikattu keskiarvo voi olla parempi mittauspaikka kuin mediaani, eikä tavallinen keskiarvo olisi sijainnin mitta. Mitä sijainnin mittana käytetään, riippuu jakautumisesta. Esimerkki, josta kurtosis ei ole hyödyllistä indikaattorina, on tasainen jakauma, jonka keskimääräinen ääriarvo on parempi mittauspaikka kuin sekä mediaani että keskiarvo.
Ei piste. Jos olet kiinnostunut kokonaissummasta, esimerkiksi dollareista, tavallinen keskiarvo on haluamasi sijainnin mitta.
Jos sinulla on Cauchy-hajautettu muuttuja, voit tehdä tapauksen ansaituista dollareista, mutta keskiarvo ei ole erityisen hyödyllinen sijainnin mitta, mikä tarkoittaa, että ” odotettu arvo ” ei ole siihen liittyvä kohtuullinen odotus.

Answer 3

Kurtoosi osoittaa myös epäsymmetriset hännät. Kaksisuuntaisessa hypoteesitestissä yksi häntä on pitkä ja toinen lyhyt. Yksi hännistä voi olla> alfa, mutta < beeta. Yksi häntä läpäisi p-arvon, mutta toinen ei.

Periaatteessa tilastollinen päättely olettaa normaalin normaalin. Kun se ei ole normaali normaali, saatat päästä toimeen joihinkin kehittyneempiin päätelmämekaniikoihin perustuvalla päätelmällä. Saatat pystyä käyttämään meille Poissonin päätelmiä, mutta jakaumalla, joka ei ole normaalia, et voi käyttää päätelmää, joka perustuu normaaleihin.

Vino ja kurtoosi ovat epänormaalisuuden mitta. Opimme ottamaan keskiarvot ja käyttämään normaalijakaumia ennen kuin tiedämme, että meidän on testattava normaalisuus. Normaali vaatii vähintään 36 datapistettä kustakin ulottuvuudesta. Voit arvioida 20 datapisteessä, mutta sinulla on edelleen vinous ja kurtosis. Kun jakauma lähestyy normaalia, vino ja jakauma katoavat.

Yksi selityksistä määritti kurtoosin huipuksi. Toinen ei.Tämä on rauhaton taistelu tällä hetkellä. Kurtosis on neljäs hetki, alue. Olen ongelman huipussa.

Toinen idea, joka on ulkona, on, että mediaani nojaa vinossa tilaan, joka muodostaa kolmion. Nauti.

Kommentit

Ei ’ ole selvää, että tämä lisäisi jo hyödyllisiin vastauksiin mitään hyödyllistä ja erilaista. Se lisää useita hämmentäviä lausuntoja esim. ” normaali vaatii vähintään 36 datapistettä ” (joten 35 ei ole kunnossa? mikä on tämän vaatimuksen perusta? ” vinous huippuina ” En ’ usko kenenkään väittävän tätä. ” tilastollinen päättely olettaa normaalin normaalin ”: ei yleensä. Kurtoosi on neljäs hetki, alue: ei; tässä määritelty kurtoosi on dimensioton suhde, joka perustuu neljäs ja toinen hetki keskiarvosta.
Neljäs hetki on kiinteä osa, joten se on alue. Kuinka alue käännetään saavuttaa huippunsa tai kaarevuuteni menetetään minussa.
Heille tyypillinen kurtosiksen selitys on huipentuma, mutta se on mielestäni väärin ’. ’ muokkaan alkuperäistä vastaustani muuttamaan vinoutta, koska korkeus sanoa kurtoosi on … Kiitos.
Hännät eivät ole symmetrisiä. En ’ ole koskaan nähnyt mitään epäsymmetrisistä hännistä pitävistä tilastollisista päätelmistä. Kurtoosiriski tapahtuu, koska hännät liikkuvat, kun enemmän datapisteitä kerätään. Kallistus ja kurtosis tarkoittaa, että meillä ei ole tarpeeksi tietoja normaalin normaalin saavuttamiseksi.
Ei niin: teoriaa ja sovelluksia on olemassa eksponentiaalisille, gamma-, Weibull- ja monille monille muille jakeluille, jotka eivät ole normaaleja. .

Miksi korkea positiivinen kurtoosi on ongelmallinen hypoteesitesteissä?

Kommentit

Vastaa

Kommentit

Vastaa

Kommentit

Vastaus

Kommentit

Vastaa Peruuta vastaus