Jai lu le livre de Tukey « Exploratory Data Analysis ». Ecrit en 1977, le livre met laccent sur les méthodes papier / crayon. Existe-t-il un successeur plus «moderne» qui tient compte du fait que nous pouvons maintenant tracer instantanément de grands ensembles de données?

Commentaires

  • devrait-il sagir dun wiki de la communauté?
  • Il ' s pas clair pour moi si cela devrait être CW. Il ny a peut-être pas de bonnes réponses; il peut y avoir une réponse claire et en suspens; nous pourrions générer une longue liste de réponses efficaces. Laissez ' voir ce qui se passe.
  • Cest une bonne question, biofreezer. Je voulais juste faire remarquer quil existe des analogies étroites avec dautres méthodes de travail. Mon préféré est le papier Pen & EDA est aux statistiques modernes comme les outils manuels le sont au travail du bois moderne. (Le travail du bois " moderne " utilise de nombreux outils électriques comme des scies à table et des routeurs qui permettent même aux débutants dobtenir des résultats acceptables en beaucoup moins de temps. Cependant , ces outils représentent également des milliers de chiffres et de membres manquants chaque année. Les personnes qui apprennent à utiliser des outils à main apprennent généralement à travailler mieux et plus efficacement même lorsquelles utilisent des outils électriques.)
  • Oui, le travail du bois est un belle analogie (chiffres manquants, chiffres manquants). Voir aussi software-carpentry.org .

Réponse

La chose la plus proche est Cleveland » Visualizing Data . Il sagit de lanalyse exploratoire des données, il sagit de visualisations générées par ordinateur, cest « profond, cest » un classique.

Commentaires

  • Il en va de même pour le livre Les éléments des données graphiques du même auteur. Achetez les deux, elles sont toutes les deux excellentes.

Réponse

Eh bien, ce nest pas une réplique exacte, mais jai trouvé des tonnes de conseils de traçage utiles (et de code R) dans Gelman and Hill « s Analyse des données à laide de la régression et de plusieurs niveaux / hiérarchiques Modèles

De plus, son blog regorge souvent de conseils graphiques utiles.

Réponse

Graphiques interactifs pour lanalyse des données: principes et exemples est celui que jaime; la description du livre dit quil « discute de lanalyse exploratoire des données (EDA) et de la façon dont les méthodes graphiques interactives peuvent aider à obtenir des informations ainsi quà générer de nouvelles questions et hypothèses à partir des ensembles de données. »

Le livre ggplot2 de Hadley Wickham est intéressant car il enseigne à la fois la grammaire graphique et lutilisation du logiciel ggplot2 .

Réponse

Ronald Pearson « s Explorer les données en ingénierie, le Les sciences et la médecine méritent dêtre mentionnées ici. Son principal lectorat cible semble être des scientifiques nayant pas peur dun peu de mathématiques qui souhaiteraient connaître plus de statistiques. Cest un groupe assez important et bien représenté ici. C « est un peu original et décalé, mais il couvre beaucoup de terrain et il comprend de nombreux conseils judicieux. Ce n » est pas Tukey revisité dans le sens où il offre beaucoup de nouvelles idées, mais cela peut être gratifiant d « étudier, même quand on y pense cest un peu fausse.

Ce livre semble avoir attiré très peu dattention, très probablement parce quil est très cher, ne convient pas de toute évidence comme texte de cours et nest encore disponible quen version cartonnée. Mais il est intelligent et lisible et exempt des déchets des manuels dintroduction modernes (pages et pages dexercices élémentaires, icônes idiotes, photos gratuites de jeunes heureux, mise en page pointilleuse avec des boîtes, peu importe, etc.).

Réponse

Aussi Graphiques interactifs et dynamiques pour lanalyse des données: avec des exemples Utilisation de R et GGobi, Cook et Swayne

Il comporte deux chapitres accessibles au public sur le Web qui décrivent le processus danalyse des données et la gestion des valeurs manquantes. Un nouveau livre dAntony Unwin sortira bientôt.

Réponse

Voici quelques autres bons livres à lire: Beautiful Visualization et Beautiful Data. Ce sont des livres édités, il y a des exemples étonnamment bons dexploration de données avec des graphiques, et des chapitres absolument épouvantables.

Un autre livre qui a quelques bons exemples dutilisation de ggplot2 est un nouveau par Winston Chang

Commentaires

  • Je veux juste vérifier, Di, au cas où une faute de frappe subtile se serait glissée: vouliez-vous peut-être écrire " attrayant " au lieu de " épouvantable "?Bien que les deux aient un sens dans ce contexte, l’apparition de ce dernier – sans autre explication – est plutôt une surprise!
  • épouvantable était correcte – c’est un sac mélangé – les volumes édités le sont souvent
  • Je ' suis surpris de ces recommandations. Jai trouvé les deux livres pour la plupart décevants (long sur guff, court sur les graphiques). Malheureusement, O ' Reilly, que jai rencontré pour la première fois en tant quéditeur de livres Unix remarquablement bons, semble avoir un contrôle de qualité très inégal pour les livres, même à distance statistique.
  • Jaime les deux livres et je pense vraiment que ce sont des contributions substantielles. Winston Chang ' s a beaucoup de détails de base sur le traçage avec ggplot2. Cest une bonne référence pour les débutants. Cela ne vous dit pas grand-chose sur la raison pour laquelle vous feriez ces intrigues, mais la plupart ont un bon sens pour le but, daprès les pièces que jai lues. The Beautiful Visualization a des chapitres très impressionnants, abordant des problèmes difficiles tels que la visualisation de wikipedia, des données massives, de nombreuses complexités, et il passe par le processus de réflexion / les décisions prises pour faire les graphiques.
  • Juste au cas où mon commentaire serait ambiguë: je faisais référence aux " Beaux " livres. Le livre de Winston Chang ' est agréable et utile.

Réponse

Je pense à Comprendre lanalyse robuste et exploratoire par Hoaglin, Mosteller et Tukey et le volume daccompagnement sur lexploration des tables et des formes de données comme suivi technique de lEDA. Je vois aussi lanalyse et la régression des données, un deuxième cours de statistique par Mosteller et Tukey comme suivi de lEDA. Les différents livres de Cleveland mentionnés ci-dessus sont des trésors.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *