Am citit cartea lui Tukey „Exploratory Data Analysis”. Fiind scrisă în 1977, cartea pune accentul pe metodele de hârtie / creion. Există un succesor mai „modern” care să ia în considerare faptul că acum putem trage instantaneu seturi mari de date?
Comentarii
- ar trebui să fie o comunitate wiki?
- Este ‘ s nu îmi este clar dacă ar trebui să fie CW. S-ar putea să nu existe răspunsuri bune; poate exista un răspuns clar remarcabil; am putea genera o listă lungă de răspunsuri eficiente. Să ‘ să vadă ce se întâmplă.
- Aceasta este o întrebare bună, biofreezer. Am vrut doar să remarc că există analogii strânse cu alte metode de lucru. Preferatul meu este, pen & hârtia EDA este pentru statistici moderne, precum instrumentele manuale sunt pentru prelucrarea modernă a lemnului. (” Modern ” prelucrarea lemnului folosește multe instrumente electrice, cum ar fi ferăstrău de masă și routere, care permit chiar și începătorilor să obțină rezultate acceptabile în mult mai puțin timp. Cu toate acestea, , aceste instrumente reprezintă, de asemenea, mii de cifre și membre care lipsesc în fiecare an. Persoanele care învață să folosească uneltele manuale în general învață să lucreze mai bine și mai eficient chiar și atunci când folosesc unelte electrice.)
- Da, prelucrarea lemnului este o analogie frumoasă (cifre lipsă, cifre lipsă). A se vedea și software-carpentry.org .
Răspuns
Cel mai apropiat lucru este Cleveland” Vizualizarea datelor . Este vorba despre Analiza datelor exploratorii, este despre vizualizări generate de computer, este profundă, este clasică.
Comentarii
- Același lucru se aplică și cărții The Elements of Graphing Data de același autor. Cumpărați-le pe amândouă; ambele sunt excelente.
Răspuns
Ei bine, nu este o replică exactă, dar am găsit o mulțime de sfaturi utile de trasare (și cod R) în Gelman și Hill „s Analiza datelor folosind regresie și niveluri multiple / ierarhice Modele
În plus, blogul său este adesea plin de sfaturi utile despre grafică.
Răspuns
Grafică interactivă pentru analiza datelor: principii și exemple este una care îmi place; descrierea cărții spune că „discută analiza datelor exploratorii (EDA) și modul în care metodele grafice interactive pot ajuta la obținerea de informații, precum și la generarea de noi întrebări și ipoteze din seturile de date.”
Răspuns
Cartea ggplot2 a lui Hadley Wickham este interesantă, deoarece predă atât Gramatica graficii, cât și modul de utilizare a software-ului ggplot2 .
Răspuns
Ronald Pearson „s Explorarea datelor în inginerie, Științe și medicină merită menționate aici. Cititorul său principal țintă pare să fie oamenii de știință care nu se tem de puțină matematică care ar dori să știe mai multe statistici. Acesta este un grup destul de mare și unul bine reprezentat aici. „Este puțin ciudat și neobișnuit, dar acoperă o mulțime de terenuri și include sfaturi foarte sensibile. Nu este Tukey revizuit în sensul că oferă multe idei noi, dar poate fi plin de satisfacții să studiezi, chiar și atunci când crezi este puțin greșit.
Această carte pare să fi atras foarte puține atenții, probabil pentru că este foarte scumpă, nu este evident potrivită ca text de curs și încă disponibilă doar pe carton. Dar este inteligent și lizibil și fără gunoiul manualelor introductive moderne (pagini și pagini de exerciții elementare, icoane prostești, fotografii gratuite ale tinerilor fericiți, dispunere agitată cu cutii, orice altceva etc.).
Răspuns
De asemenea, Grafică interactivă și dinamică pentru analiza datelor: cu exemple Folosind R și GGobi, Cook și Swayne
Acesta are două capitole disponibile public pe web care descriu procesul de analiză a datelor și gestionarea valorilor lipsă. În curând apare o nouă carte de Antony Unwin.
Răspuns
O altă pereche de cărți bune de citit sunt Beautiful Visualization și Beautiful Data. Acestea sunt cărți editate, există exemple uimitor de bune de explorare a datelor cu comploturi și câteva capitole absolut îngrozitoare.
O altă carte care are câteva exemple bune de utilizare a ggplot2 este unul nou de Winston Chang
Comentarii
- Vreau doar să verific de două ori, Di, în cazul în care s-a strecurat un tipar subtil: ai vrut probabil să scrii ” atrăgător ” în loc de ” îngrozitor „?Deși ambele au sens în acest context, apariția acestuia din urmă – fără alte explicații – este mai degrabă o surpriză!
- îngrozitor a fost corect – este un sac mixt – volumele editate sunt adesea
- Sunt ‘ surprins de aceste recomandări. Am găsit ambele cărți în cea mai mare parte dezamăgitoare (lungă pe guf, scurtă pe grafică). Din păcate, O ‘ Reilly, pe care l-am întâlnit pentru prima dată ca editor al cărților Unix spectaculos de bune, pare să aibă un control al calității foarte inegal pentru cărți despre orice, chiar și de la distanță statistic.
- Îmi plac ambele cărți și simt cu adevărat că sunt contribuții substanțiale. Winston Chang ‘ s are o mulțime de detalii de bază despre complotarea cu ggplot2. Este o referință bună pentru începători. Nu vă spune prea multe despre motivele pentru care ați face aceste comploturi, dar majoritatea au un bun sens în acest scop, din piesele pe care le-am citit. Frumoasa vizualizare are câteva capitole foarte impresionante, abordând probleme dificile, cum ar fi vizualizarea Wikipedia, date masive, multe complexități și trece prin procesul de gândire / deciziile luate pentru a face comploturile.
- În caz că comentariul meu este ambiguu: mă refeream la ” frumoase ” cărți. Cartea lui Winston Chang ‘ este plăcută și utilă.
Răspuns
Mă gândesc la Înțelegerea analizei robuste și exploratorii de către Hoaglin, Mosteller și Tukey, un volum însoțitor despre explorarea tabelelor și formelor de date, ca urmare tehnică a EDA. De asemenea, văd analiza și regresia datelor, un al doilea curs de statistici de Mosteller și Tukey ca urmare a EDA. Diferitele cărți din Cleveland menționate mai sus sunt comori.