Histogrammit antavat hyvän käsityksen muuttujan jakaumasta. Laatikkokaaviot yrittävät tehdä saman asian, mutta älä anna niin hyvää kuvaa tämän muuttujan jakaumasta.

En ymmärrä, miksi ihmiset käyttävät laatikkotontteja. Histogrammit ovat kaikin tavoin parempia. Onko syytä käyttää molempia?

Ainoa asia, jonka luulen laatikkotonttien tarjoavan, on: poikkeamat! Se kertoo meille, mitkä havainnot voivat olla poikkeavia.

Kommentit

  • Onko histogrammi kaikin tavoin huonompi kuin koko jakauman esitys?
  • Riippuu siitä, mitä haluat, laatikkokaavion avulla sinulla voi olla joitain tarkkoja arvoja (esim. mediaani, P75), joita sinulla ei ole histogrammin kanssa. Se näyttää vähemmän tietoja, mutta on synteettisempi. Mielestäni jopa histogrammi on yksinkertaistaminen ja tiedon tuhlaaminen koko jakeluun verrattuna. Mutta sen käyttö voi olla helpompaa.
  • Histogrammien hyödyllisyyttä koskeva päinvastainen näkemys on ilmaistu vakuuttavasti ja hyvin havainnollistettu erittäin arvostetuissa postauksissa -tilastoissa .stackexchange.com / a / 51753 (joka löytyy hakemalla sivustoltamme ” histogrammi ”).
  • Mielenkiintoinen ajatus – mutta roskakorin koon kasvattaminen vähentäisi histogrammin laatikkokuvan kaltaiseksi kuvaksi pitäen samalla valitettavan riippuvuutensa leikkauspisteiden valinnasta. IMHO, laatikkopelien todelliset hyödyt voidaan parhaiten arvioida tutkimalla Tukey ’ n N-kirjaimen yhteenvedon käyttöä monimuuttujatiedon tutkivaan analyysiin ja muistamalla, että hän laski lyijykynällä ja paperilla tällä hetkellä. Visualisoinnissa, kuten ” vaeltava kaavamainen jälki ”, muut yksimuuttuiset yhteenvedot ehdollisista vastauksista, kuten histogrammit tai viulukuviot, eivät yksinkertaisesti toimi.
  • Histogrammin kaksi epäonnistumista (imo) tapahtuvat, kun näytteitä on vähän tai kun laatikot ovat väärän kokoisia. Hyvän laatikkoalueen heikkous (ja minä ajattelen JMP-variaatiota, kun sanon sen) ovat multimodaalisuus ja hienot yksityiskohdat. Yksi paikka, jossa laatikko loistaa, on, kun näytteitä on vähän. Pidän siitä myös, kun eri tasoilla on useita vuorovaikutuksessa olevia muuttujia – siis JMP-vaihtelukuvaaja.

Vastaa

Se, että laatikkokaaviot tarjoavat enemmän yhteenvedon jakaumasta, voidaan myös nähdä etuna tietyissä tapauksissa. Joskus kun vertailemme jakaumia, emme välitä yleisestä muodosta, vaan pikemminkin siitä, missä jakaumat ovat toistensa suhteen. Kvantiilien piirtäminen vierekkäin voi olla hyödyllinen tapa tehdä tämä häiritsemättä meitä muista yksityiskohdista, joista emme välttämättä välitä.

Kommentit

  • Tämä on paras vastaus. Boxplotit ovat parempia vertailemaan jakaumia kuin histogrammit!

Answer

Yksimuuttujaisessa tapauksessa box-plotit tarjoavat joitain tietoja, joita histogrammi ei (ainakaan nimenomaisesti). Toisin sanoen se antaa tyypillisesti mediaanin, 25. ja 75. persentiilin, min / max, joka ei ole syrjäytymistä, ja erottaa nimenomaisesti pisteitä, joita pidetään poikkeavina. Tämä kaikki voidaan ”silmällöidä” histogrammista (ja voi olla parempi olla silmämunalla poikkeamien tapauksessa).

Paljon suurempi etu on kuitenkin verrata jakaumia useisiin eri ryhmiin kerralla. Yli 10 ryhmässä tämä on väsyttävä tehtävä rinnakkaisilla histogrammeilla, mutta erittäin helppo laatikkokaavioilla.

Kuten mainitsit, viulukuviot (tai papupalat) ovat jonkin verran informatiivisempia vaihtoehtoja. Ne vaativat kuitenkin hieman enemmän tilastotietoa kuin laatikkokaaviot (ts. Jos ne esitetään muulle kuin tilastolliselle yleisölle, se voi olla hieman pelottavampaa), ja laatikkokaaviot ovat olleet paljon pidempiä kuin ytimen tiheyden estimaattorit, joten niiden suurempi suosio.

kommentit

  • +1. Korjaus on kuitenkin, että laatikko-juonet tarjoavat mediaaneja, ei keinoja.
  • Jokainen voi olla oikeassa. Laatikkoesitykset, kuten tavallisesti piirretään, näyttävät mediaaneja (olen ’ nähnyt tämän kieltävän, mutta en muista, että olisin nähnyt esimerkkiä). Mutta joidenkin toteutusten avulla voit näyttää myös keinoja. Se ’ on usein hyvä idea.
  • Kiitos huomautuksesta. Ajattelen (väärin) sitä ’ yleensä keskiarvoa, mikä voi johtaa äärimmäisissä tapauksissa hyvin outoihin juoniin.
  • olisi hienoa, jos kuvia olisi tämän kanssa näytetään rinnakkaisten vertailujen arvo laatikkokaavioilla vs histogrammeilla

vastaus

  1. Jos näytän sinulle histogrammin ja kysyn sinulta, missä mediaani on, saatat olla jo jonkin aikaa selvittämässä sitä … ja sitten saat vain likiarvon siihen.Jos teen saman laatikkotiedon kanssa, sinulla on se heti; jos se kiinnostaa sinua, boxplotit tietysti voittavat.

  2. Olen samaa mieltä siitä, että boxplotit eivät ole yhtä tehokkaita kuin jakelun kuvaus yhdestä näytteestä, koska ne pienentävät sen muutamaan pisteeseen, mikä ei kerro sinulle paljon.

    Jos kuitenkin verrataan useita kymmeniä jakaumia, jokaisen yksityiskohdat saattavat olla enemmän tietoa kuin on helppo verrata – saatat haluta supistaa tiedot pienempään määrään vertailtavia asioita.

  3. Jos enemmän tietoja on parempia, on monia parempia valintoja kuin histogrammi; esimerkiksi varsi- ja lehtikuvaaja tai ecdf / kvantiili-käyrä.

    Tai voit lisätä tietoja histogrammiin:

histogrammi, jossa on marginaali laatikko histogrammi rugplot, jossa on värinää histogrammi, jossa on nauhakaavio

( juoni tästä vastauksesta )

Ensimmäinen niistä – kapean laatikkoalueen lisääminen marginaaliin – antaa sinulle mahdollisia etuja kummastakin näytöstä.

Vastaus

Pylväskaaviot tarjoavat vain havainnointitaajuusalueen, kun taas laatikkokaaviot kertovat paremmin, missä useita jakeluparametrit, esimerkkikeskiarvo ja varianssit, joita pylväskaaviot eivät voi. Laatikkokaavioita käytetään siis tehokkaana vertailutyökaluna, jos jakaumia on useita.

Kommentit

  • On harvinaista, että laatikko kuvaa keskiarvon näyttämistä. – melkein aina he käyttävät mediaaneja – ja ne eivät koskaan edusta variansseja suoraan. Huomaa myös, että näitä määriä ei yleensä pidetä ” -jakauman parametreina ”: ne ovat kuvaavia tilastoja erälle data .
  • Tarkalleen, ne ovat hieno työkalu kuvaamaan jakaumaa menemättä liikaa laskelmia. Ja he näyttävät mediaaneja enemmän, ja koska monissa tapauksissa molemmat mitat yhtyvät, laatikkokaaviot ovat myös hieno työkalu keskiarvon arvioimiseksi.
  • Kommenttisi näyttää edelleen hämmentävän tietoja taustalla olevan jakauman kanssa. On hyvin harvinaista, että keskiarvo vastaa mediaania missä tahansa tietoryhmässä. Lisäksi yksi laatikkokuvan paremmista ja yleisimmistä käyttötavoista on tunnistaa epäsymmetria, mikä yleensä merkitsee merkittävää eroa keskiarvon ja mediaanin välillä. Yksi laatupolitiikan alkuperäisen käsityksen taustalla olevista perusperiaatteista on, että se on vankka etsintätyökalu – mikä tarkoittaa, että sen ei pidä perustua arkaluontoisiin tilastoihin, kuten keskiarvo tai varianssi.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *