Olvastam Tukey “Feltáró adatok elemzése” című könyvét. 1977-ben írták, a könyv a papír / ceruza módszereket hangsúlyozza. Van-e egy “modernebb” utód, amely figyelembe veszi, hogy most azonnal képesek vagyunk nagy adathalmazok megtervezésére?
Megjegyzések
- legyen ez közösségi wiki?
- Ez ' s számomra nem világos, hogy ennek CW-nek kell-e lennie. Lehet, hogy nincsenek jó válaszok; lehet egy egyértelmű kiemelkedő válasz; hosszú listát készíthetünk a hatékony válaszokról. Lássa ' s, mi történik.
- Ez egy jó kérdés, biofagyasztó. Csak azt szerettem volna megjegyezni, hogy szoros analógiák vannak más munkamódszerekkel. A kedvencem, a toll & papír EDA a modern statisztikákhoz, valamint a kéziszerszámok a modern famegmunkáláshoz. (" A modern " famegmunkálás számos elektromos szerszámot, például asztallapokat és routereket alkalmaz, amelyek lehetővé teszik, hogy a kezdők is sokkal kevesebb idő alatt el tudják érni az elfogadható eredményeket. , ezek az eszközök évente több ezer hiányzó számjegyet és végtagot jelentenek. Azok, akik megtanulják a kéziszerszámok használatát, általában még akkor is megtanulnak jobb és hatékonyabb munkát, ha elektromos szerszámokat alkalmaznak.)
- Igen, a famegmunkálás szép hasonlat (hiányzó számjegyek, hiányzó számjegyek). Lásd még: software-carpentry.org .
Válasz
A legközelebbi dolog: Cleveland” adatok vizualizálása . “A feltáró adatok elemzéséről, a” kb. ” számítógéppel generált vizualizációk, mélyek, klasszikusak.
Megjegyzések
- Ugyanez vonatkozik a Az elemek könyvre is Az adatok grafikonja ugyanazon szerző által. Vásárolja meg mindkettőt; mindkettő kiváló.
Válasz
Nos, ez nem egy pontos mása, de rengeteg hasznos tervezési tanácsot (és R kódot) találtam a Gelman and Hill “s adatelemzésben regressziós és többszintű / hierarchikus módszerekkel. Modellek
Emellett blogja gyakran tele van hasznos grafikai tanácsokkal.
Válasz
Interaktív grafika az adatelemzéshez: alapelvek és példák olyan, amit szeretek; a könyvleírás szerint “tárgyalja a feltáró adatok elemzését (EDA) és azt, hogy az interaktív grafikus módszerek hogyan segíthetnek betekintést nyerni, valamint új kérdéseket és hipotéziseket generálni az adatkészletekből.”
Válasz
Hadley Wickham ggplot2 könyve érdekes, mert megtanítja a grafika nyelvtanát és a ggplot2 szoftver használatát .
Válasz
Ronald Pearson “s Adatok feltárása a mérnöki Itt érdemes megemlíteni a tudományokat és az orvostudományt . Úgy tűnik, hogy a fő olvasóközönség egy kis matematikától nem félő tudós, aki azt szeretné, ha több statisztikát tudna. Ez elég nagy csoport, és itt egy jól képviselteti magát. “Kicsit furcsa és ritka, de rengeteg terepet lefed, és sok ésszerű tanácsot tartalmaz. Nem Tukey újból megvizsgálta abban az értelemben, hogy sok új ötletet kínál, de kifizetődő lehet a tanulmányozás, még ha belegondol is kissé rossz fejű.
Úgy tűnik, hogy ez a könyv nagyon kevés figyelmet kapott, valószínűleg azért, mert nagyon drága, nyilvánvalóan nem alkalmas tanfolyamszövegként, és egyelőre csak keménykötésben érhető el. De intelligens, olvasható és mentes a modern bevezető tankönyvektől (oldalak és oldalak elemi gyakorlatoktól, buta ikonok, boldog fiatalok ingyen fotói, nyűgös elrendezés dobozokkal, bármi stb.).
Válasz
Ennek két fejezete nyilvánosan elérhető az interneten, amelyek leírják az adatelemzés folyamatát és a hiányzó értékek kezelését. Hamarosan megjelenik egy új könyv Antony Unwin által.
Válasz
További néhány jó könyv, amelyet el kell olvasni: Gyönyörű megjelenítés és Gyönyörű adatok. Ezek szerkesztett könyvek, elképesztően jó példák találhatók az adatok telkekkel történő feltárására, és néhány teljesen megdöbbentő fejezet.
Egy másik könyv amelynek van néhány jó példája a ggplot2 használatára, az egy új, a Winston Chang
megjegyzések
- Csak át akarom ellenőrizni, Di, hátha beindul egy finom elírási hiba: talán azt akartad írni, hogy " vonzó " " megdöbbentő " helyett?Bár mindkettőnek van értelme ebben az összefüggésben, ez utóbbi megjelenése – minden további magyarázat nélkül – meglepetés!
- A megdöbbentő volt a helyes – ez egy vegyes táska – a szerkesztett kötetek gyakran
- Meglepődtem ezen ajánlásokon '. Mindkét könyvet többnyire kiábrándítónak találtam (hosszú a guff, rövid a grafika). Sajnos O ' Reilly, akivel először találkoztam, mint látványosan jó Unix-könyvek kiadója, úgy tűnik, nagyon egyenetlen minőségellenőrzéssel rendelkezik a könyvekkel kapcsolatban, méghozzá távolról is statisztikai szempontból.
- Szeretem mindkét könyvet, és nagyon érzem, hogy ezek jelentős hozzájárulások. Winston Chang ' s sok alapvető részletet tartalmaz a ggplot2-vel való ábrázolásról. Ez egy jó kezdő referencia. Nem sokat árul el arról, hogy miért készítené ezeket a cselekményeket, de a legtöbbnek van értelme erre a célra, az általam olvasott darabokból. A Gyönyörű vizualizációnak nagyon hatásos fejezetei vannak, amelyek olyan nehéz problémákat kezelnek, mint a wikipédia vizualizálása, hatalmas adatok, sok bonyolultság, és végiggondolja a gondolkodási folyamatot / a cselekmények elkészítéséhez hozott döntéseket. kétértelmű: a " Gyönyörű " könyvekre utaltam. Winston Chang ' könyve kedves és hasznos.
Válasz
Azt gondolom, hogy megértem Hoaglin, Mosteller és Tukey átfogó és feltáró elemzését, és egy kísérő kötetet az Adattáblák és alakzatok feltárásáról, mint az EDA technikai nyomon követéséről. Az adatelemzést és a regressziót, Mosteller és Tukey statisztikai második tanfolyamát is az EDA nyomán látom. A fent említett különféle clevelandi könyvek kincsek.