Ich habe Tukeys Buch „Exploratory Data Analysis“ gelesen. Das Buch wurde 1977 geschrieben und konzentriert sich auf Papier / Bleistift-Methoden. Gibt es einen „moderneren“ Nachfolger, der berücksichtigt, dass wir jetzt große Datenmengen sofort zeichnen können?

Kommentare

  • Sollte dies ein Community-Wiki sein?
  • Es ‚ s mir nicht klar, ob dies CW sein sollte. Möglicherweise gibt es keine guten Antworten. es kann eine klare offene Antwort geben; Wir könnten eine lange Liste effektiver Antworten erstellen. Lassen Sie ‚ sehen, was passiert.
  • Dies ist eine gute Frage, Biofreezer. Ich wollte nur bemerken, dass es enge Analogien zu anderen Arbeitsmethoden gibt. Mein Favorit ist, Stift & Papier EDA ist für moderne Statistiken wie Handwerkzeuge für moderne Holzbearbeitung. (“ Moderne “ Holzbearbeitung verwendet viele Elektrowerkzeuge wie Tischsägen und Fräser, mit denen selbst Anfänger in viel kürzerer Zeit akzeptable Ergebnisse erzielen können Diese Werkzeuge verursachen jedes Jahr Tausende fehlender Ziffern und Gliedmaßen. Menschen, die lernen, Handwerkzeuge zu benutzen, lernen im Allgemeinen, besser und effizienter zu arbeiten, selbst wenn sie Elektrowerkzeuge verwenden.)
  • Ja, Holzbearbeitung ist eine schöne Analogie (fehlende Ziffern, fehlende Ziffern). Siehe auch software-carpentry.org .

Antwort

Das Nächste ist Clevelands Visualisierung von Daten . Es geht um explorative Datenanalyse, es geht um Computergenerierte Visualisierungen, es ist tiefgreifend, es ist ein Klassiker.

Kommentare

  • Gleiches gilt auch für das Buch The Elements von Grafikdaten desselben Autors. Kaufen Sie beide, beide sind ausgezeichnet.

Antwort

Nun, es ist keine exakte Nachbildung, aber ich habe in Gelmans und Hills Datenanalyse mit Regression und Multilevel / Hierarchical jede Menge nützliche Plot-Ratschläge (und R-Code) gefunden Models

Darüber hinaus enthält sein Blog häufig nützliche Ratschläge zu Grafiken.

Antwort

Interaktive Grafiken für die Datenanalyse: Prinzipien und Beispiele ist eine, die ich mag; In der Buchbeschreibung heißt es: „Erläutert die explorative Datenanalyse (EDA) und wie interaktive grafische Methoden dazu beitragen können, Erkenntnisse zu gewinnen und neue Fragen und Hypothesen aus Datensätzen zu generieren.“

Antwort

Hadley Wickhams ggplot2-Buch ist interessant, da es sowohl die Grammatik der Grafik als auch die Verwendung der ggplot2-Software lehrt .

Antwort

Ronald Pearsons Exploring Data in Engineering, the Wissenschaften und Medizin sind hier erwähnenswert. Die Hauptzielgruppe scheinen Wissenschaftler zu sein, die keine Angst vor ein wenig Mathematik haben und sich wünschen, mehr Statistiken zu kennen. Das ist eine ziemlich große Gruppe, die hier gut vertreten ist. Es ist „ein wenig schrullig und unkonventionell, aber es deckt viel Boden ab und es enthält viele vernünftige Ratschläge. Es ist nicht Tukey in dem Sinne überarbeitet, dass es viele neue Ideen bietet, aber es kann sich lohnen, zu studieren, selbst wenn Sie denken es ist ein wenig falsch.

Dieses Buch scheint sehr wenig Beachtung gefunden zu haben, möglicherweise weil es sehr teuer ist, offensichtlich nicht als Kurstext geeignet ist und bisher nur als gebundenes Buch erhältlich ist. Aber es ist intelligent und lesbar und frei von dem Müll moderner Einführungslehrbücher (Seiten und Seiten mit Grundübungen, albernen Symbolen, unentgeltlichen Fotos von glücklichen jungen Menschen, pingeligem Layout mit Kisten, was auch immer usw.).

Antwort

Auch Interaktive und dynamische Grafiken für die Datenanalyse: Mit Beispielen Verwenden von R und GGobi, Cook und Swayne

Im Web sind zwei Kapitel öffentlich verfügbar, die den Prozess der Datenanalyse und den Umgang mit fehlenden Werten beschreiben. In Kürze erscheint ein neues Buch von Antony Unwin.

Antwort

Ein paar weitere gute Bücher zum Lesen sind Schöne Visualisierung und schöne Daten. Dies sind bearbeitete Bücher, es gibt erstaunlich gute Beispiele für das Erkunden von Daten mit Plots und einige absolut entsetzliche Kapitel.

Ein weiteres Buch Das gibt einige gute Beispiele für die Verwendung von ggplot2 ist ein neues von Winston Chang

Kommentare

  • Ich möchte es nur noch einmal überprüfen, Di, falls sich ein subtiler Tippfehler eingeschlichen hat: Wollten Sie vielleicht “ ansprechend “ statt “ entsetzlich „?Obwohl beide in diesem Zusammenhang sinnvoll sind, ist das Erscheinen des letzteren – ohne weitere Erklärung – eher eine Überraschung!
  • entsetzlich war richtig – es ist eine gemischte Tasche – bearbeitete Bände sind oft
  • Ich ‚ bin überrascht über diese Empfehlungen. Ich fand beide Bücher meistens enttäuschend (lang auf kurz, kurz auf Grafik). Leider scheint O ‚ Reilly, dem ich zum ersten Mal als Herausgeber spektakulär guter Unix-Bücher begegnet bin, eine sehr ungleichmäßige Qualitätskontrolle für Bücher zu haben, die auch nur aus der Ferne statistisch sind.
  • Ich mag beide Bücher und denke wirklich, dass sie wesentliche Beiträge sind. Winston Chang ‚ s enthält viele grundlegende Details zum Plotten mit ggplot2. Es ist eine gute Referenz für Anfänger. Es sagt Ihnen nicht viel darüber, warum Sie diese Handlungen machen würden, aber die meisten sind für den Zweck sinnvoll, aus den Stücken, die ich gelesen habe. Die schöne Visualisierung enthält einige sehr beeindruckende Kapitel, die sich mit schwierigen Problemen wie der Visualisierung von Wikipedia, massiven Daten und vielen Komplexitäten befassen. Sie durchläuft den Denkprozess / die Entscheidungen, die zur Erstellung der Handlungen getroffen wurden.
  • Nur für den Fall, dass mein Kommentar lautet mehrdeutig: Ich bezog mich auf die “ Schöne “ Bücher. Das Buch von Winston Chang ‚ ist nett und hilfreich.

Antwort

Ich denke daran, die robuste und explorative Analyse von Hoaglin, Mosteller und Tukey und den Begleitband zum Erkunden von Datentabellen und -formen als technisches Follow-up zu EDA zu verstehen. Ich sehe auch Datenanalyse und Regression, einen zweiten statistischen Kurs von Mosteller und Tukey als Follow-up zu EDA. Die verschiedenen oben erwähnten Cleveland-Bücher sind Schätze.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.