He estado leyendo el libro de Tukey «Análisis de datos exploratorios». Escrito en 1977, el libro enfatiza los métodos de papel / lápiz. ¿Existe un sucesor más «moderno» que tenga en cuenta que ahora podemos trazar instantáneamente grandes conjuntos de datos?

Comentarios

  • ¿Debería ser un wiki de la comunidad?
  • Es ‘ s No me queda claro si esto debería ser CW. Puede que no haya buenas respuestas; puede haber una respuesta clara y pendiente; podríamos generar una larga lista de respuestas efectivas. Dejemos que ‘ s veamos qué sucede.
  • Esta es una buena pregunta, biofreezer. Solo quería señalar que existen analogías cercanas con otros métodos de trabajo. Mi favorito es, lápiz & papel EDA es para las estadísticas modernas como las herramientas de mano son para la carpintería moderna. (» La carpintería moderna » emplea muchas herramientas eléctricas como sierras de mesa y enrutadores que permiten incluso a los principiantes obtener resultados aceptables en mucho menos tiempo. Sin embargo, , estas herramientas también representan miles de dedos y extremidades faltantes cada año. Las personas que aprenden a usar herramientas manuales generalmente aprenden a trabajar mejor y de manera más eficiente incluso cuando emplean herramientas eléctricas.
  • Sí, la carpintería es una bonita analogía (dígitos faltantes, dígitos faltantes). Consulte también software-carpentry.org .

Responder

Lo más parecido es Visualización de datos de Cleveland. Se trata del análisis exploratorio de datos, visualizaciones generadas por computadora, es profundo, es un clásico.

Comentarios

  • Lo mismo se aplica también al libro The Elements de Graphing Data del mismo autor. Compre ambos; ambos son excelentes.

Respuesta

Bueno, no es una réplica exacta, pero encontré toneladas de consejos útiles de trazado (y código R) en el análisis de datos de Gelman y Hill usando regresión y multinivel / jerárquico Modelos

Además, su blog suele estar lleno de útiles consejos gráficos.

Respuesta

Gráficos interactivos para el análisis de datos: principios y ejemplos es uno que me gusta; la descripción del libro dice que «analiza el análisis exploratorio de datos (EDA) y cómo los métodos gráficos interactivos pueden ayudar a obtener conocimientos y generar nuevas preguntas e hipótesis a partir de conjuntos de datos».

Respuesta

El libro ggplot2 de Hadley Wickham es interesante porque enseña la gramática de los gráficos y cómo usar el software ggplot2 .

Respuesta

Ronald Pearson «s Explorando datos en ingeniería, el Merece la pena mencionar las Ciencias y la Medicina aquí. Su principal público objetivo parece ser los científicos que no temen un poco de matemáticas y que desearían saber más estadísticas. Es un grupo bastante grande y bien representado aquí. Es un poco peculiar y poco convencional, pero cubre mucho terreno e incluye muchos consejos sensatos. No es Tukey revisado en el sentido de que ofrece muchas ideas nuevas, pero puede ser gratificante estudiar, incluso cuando piensas es un poco equivocado.

Este libro parece haber atraído muy poca atención, posiblemente porque es muy caro, obviamente no es adecuado como texto de curso y hasta ahora solo está disponible en tapa dura. Pero es inteligente y legible y está libre de la basura de los libros de texto introductorios modernos (páginas y páginas de ejercicios elementales, iconos tontos, fotos gratuitas de jóvenes felices, maquetación quisquillosa con cajas, lo que sea, etc.).

Respuesta

También Gráficos interactivos y dinámicos para análisis de datos: con ejemplos Usando R y GGobi, Cook y Swayne

Tiene dos capítulos disponibles públicamente en la web que describen el proceso de análisis de datos y el manejo de valores perdidos. Pronto saldrá un nuevo libro de Antony Unwin.

Respuesta

Otro par de buenos libros para leer son Beautiful Visualization y Beautiful Data. Estos son libros editados, hay ejemplos asombrosamente buenos de exploración de datos con tramas y algunos capítulos absolutamente espantosos.

Otro libro que tiene algunos buenos ejemplos del uso de ggplot2 es uno nuevo de Winston Chang

Comentarios

  • Solo quiero volver a verificar, Di, en caso de que se produjera un error tipográfico sutil: ¿quizás quisiste escribir » atractivo » en lugar de » espantoso «?Aunque ambos tienen sentido en este contexto, la aparición de este último, sin ninguna explicación adicional, es bastante sorprendente.
  • espantoso era correcto, es una mezcla de libros, los volúmenes editados a menudo son
  • Estoy ‘ estoy sorprendido con estas recomendaciones. Encontré ambos libros en su mayoría decepcionantes (largos en tonterías, cortos en gráficos). Desafortunadamente, O ‘ Reilly, que encontré por primera vez como el editor de libros Unix espectacularmente buenos, parece tener un control de calidad muy desigual para los libros sobre cualquier cosa, incluso remotamente estadística.
  • Me gustan los dos libros y realmente siento que son contribuciones sustanciales. Winston Chang ‘ s tiene muchos detalles básicos sobre el trazado con ggplot2. Es una buena referencia para principiantes. No te dice mucho sobre por qué harías estas tramas, pero la mayoría tiene sentido para el propósito, por las piezas que he leído. The Beautiful Visualization tiene algunos capítulos muy impresionantes, que abordan problemas difíciles como visualizar wikipedia, datos masivos, muchas complejidades, y pasa por el proceso de pensamiento / decisiones tomadas para hacer las tramas.
  • Por si acaso mi comentario es ambiguo: me refería a los libros » hermosos «. El libro de Winston Chang ‘ es agradable y útil.

Responder

Pienso en la comprensión del análisis robusto y exploratorio de Hoaglin, Mosteller y Tukey y el volumen complementario sobre exploración de tablas y formas de datos como seguimiento técnico de la EDA. También veo análisis y regresión de datos, un segundo curso en estadística de Mosteller y Tukey como seguimiento de EDA. Los diversos libros de Cleveland mencionados anteriormente son tesoros.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *