Ho letto il libro di Tukey “Exploratory Data Analysis”. Essendo scritto nel 1977, il libro enfatizza i metodi carta / matita. Esiste un successore più “moderno” che tenga conto del fatto che ora possiamo tracciare istantaneamente grandi set di dati?

Commenti

  • dovrebbe essere questo wiki della comunità?
  • ' s non mi è chiaro se questo debba essere CW. Potrebbero non esserci buone risposte; potrebbe esserci una chiara risposta in sospeso; potremmo generare un lungo elenco di risposte efficaci. Vediamo a ' cosa succede.
  • Questa è una buona domanda, biofreezer. Volevo solo sottolineare che esistono strette analogie con altri metodi di lavoro. Il mio preferito è la penna & cartacea EDA sta alle statistiche moderne come gli strumenti manuali stanno alla moderna lavorazione del legno. (" La moderna " lavorazione del legno impiega molti utensili elettrici come seghe da tavolo e router che consentono anche ai principianti di ottenere risultati accettabili in molto meno tempo. Tuttavia , questi strumenti rappresentano anche migliaia di dita e arti mancanti ogni anno. Le persone che imparano a usare gli utensili manuali generalmente imparano a lavorare meglio e in modo più efficiente anche quando utilizzano utensili elettrici.)
  • Sì, la lavorazione del legno è un bella analogia (cifre mancanti, cifre mancanti). Vedi anche software-carpentry.org .

Risposta

La cosa più vicina è Cleveland” s Visualizzazione dei dati . Si tratta di analisi esplorativa dei dati, si tratta di visualizzazioni generate dal computer, è profondo, è un classico.

Commenti

  • Lo stesso vale anche per il libro The Elements of Graphing Data dello stesso autore. Acquistali entrambi; sono entrambi eccellenti.

Answer

Beh, non è una replica esatta, ma ho trovato un sacco di utili consigli di tracciamento (e codice R) in Gelman e Hill “s Analisi dei dati utilizzando Regressione e Multilevel / Hierarchical Modelli

Inoltre, il suo blog è spesso pieno di utili consigli grafici.

Risposta

Grafica interattiva per lanalisi dei dati: principi ed esempi è quello che mi piace; la descrizione del libro dice che “discute lanalisi esplorativa dei dati (EDA) e il modo in cui i metodi grafici interattivi possono aiutare a ottenere intuizioni e generare nuove domande e ipotesi dai set di dati.”

Risposta

Il libro ggplot2 di Hadley Wickham “ è interessante perché insegna sia la grammatica della grafica sia come utilizzare il software ggplot2 .

Risposta

Ronald Pearson “s Exploring Data in Engineering, il Vale la pena menzionare le scienze e la medicina . Il suo principale target di lettori sembra essere gli scienziati che non hanno paura di un po di matematica che vorrebbero conoscere più statistiche. Si tratta di un gruppo piuttosto numeroso e ben rappresentato qui. È “un po bizzarro e insolito, ma copre molto terreno e include molti consigli sensati. Non è Tukey rivisitato nel senso che offre molte nuove idee, ma può essere gratificante studiare, anche quando pensi è un po sbagliato.

Questo libro sembra aver attirato pochissima attenzione, molto probabilmente perché è molto costoso, non ovviamente adatto come testo del corso, e per ora è disponibile solo con copertina rigida. Ma è intelligente e leggibile e libero dalla spazzatura dei moderni libri di testo introduttivi (pagine e pagine di esercizi elementari, icone sciocche, foto gratuite di giovani felici, layout pignolo con scatole, qualunque cosa, ecc.).

Risposta

Anche Grafica interattiva e dinamica per lanalisi dei dati: con esempi Utilizzo di R e GGobi, Cook e Swayne

Questo ha due capitoli pubblicamente disponibili sul Web che descrivono il processo di analisi dei dati e la gestione dei valori mancanti. Presto uscirà un nuovo libro di Antony Unwin.

Answer

Un altro paio di buoni libri da leggere sono Beautiful Visualization e Beautiful Data. Questi sono libri modificati, ci sono esempi sorprendentemente buoni di esplorazione dei dati con trame e alcuni capitoli assolutamente spaventosi.

Un altro libro che ha alcuni buoni esempi di utilizzo di ggplot2 è uno nuovo di Winston Chang

Commenti

  • Voglio solo ricontrollare, Di, nel caso si fosse insinuato un errore di battitura sottile: forse intendevi scrivere " accattivante " invece di " spaventoso "?Sebbene entrambi abbiano senso in questo contesto, laspetto di questultimo – senza ulteriori spiegazioni – è piuttosto una sorpresa!
  • spaventoso era corretto – è un miscuglio – i volumi modificati spesso sono
  • Sono ' sono sorpreso di questi consigli. Ho trovato entrambi i libri per lo più deludenti (lungo su guff, a corto di grafica). Sfortunatamente O ' Reilly, che ho incontrato per la prima volta come editore di libri Unix straordinariamente buoni, sembra avere un controllo di qualità molto diseguale per i libri su qualsiasi cosa anche lontanamente statistica.
  • Mi piacciono entrambi i libri e sento davvero che siano contributi sostanziali. Winston Chang ' s ha molti dettagli di base sulla stampa con ggplot2. È un buon riferimento per principianti. Non ti dice molto sul motivo per cui dovresti creare queste trame, ma la maggior parte ha senso per lo scopo, dai pezzi che ho letto. The Beautiful Visualization ha alcuni capitoli molto impressionanti, che affrontano problemi difficili come la visualizzazione di wikipedia, dati enormi, molte complessità e passa attraverso il processo di pensiero / le decisioni prese per creare le trame.
  • Solo nel caso in cui il mio commento sia ambiguo: mi riferivo ai libri " Beautiful ". Il libro di Winston Chang ' è carino e utile.

Rispondi

Penso a Comprendere lanalisi solida ed esplorativa di Hoaglin, Mosteller e Tukey e il volume complementare sullesplorazione di tabelle e forme di dati come seguito tecnico di EDA. Vedo anche analisi dei dati e regressione, un secondo corso di statistica di Mosteller e Tukey come follow-up di EDA. I vari libri di Cleveland menzionati sopra sono tesori.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *