Tenho lido o livro de Tukey “Análise Exploratória de Dados”. Escrito em 1977, o livro enfatiza métodos de papel / lápis. Existe um sucessor mais “moderno” que leva em conta que agora podemos plotar instantaneamente grandes conjuntos de dados?
Comentários
- deve ser wiki da comunidade?
- É ' s não está claro para mim se isso deve ser CW. Pode não haver boas respostas; pode haver uma resposta clara e importante; podemos gerar uma longa lista de respostas eficazes. Vamos ' s ver o que acontece.
- Essa é uma boa pergunta, biofreezer. Queria apenas observar que existem analogias estreitas com outros métodos de trabalho. Meu favorito é, escrever & papel EDA está para as estatísticas modernas como as ferramentas manuais estão para a madeira moderna. (" Modern " marcenaria emprega muitas ferramentas poderosas como serras de mesa e roteadores que permitem que até mesmo os iniciantes produzam resultados aceitáveis em muito menos tempo. , essas ferramentas também são responsáveis por milhares de dígitos e membros perdidos todos os anos. Pessoas que aprendem a usar ferramentas manuais geralmente aprendem a trabalhar melhor e com mais eficiência, mesmo quando empregam ferramentas elétricas.)
- Sim, trabalhar madeira é uma boa analogia (dígitos ausentes, dígitos ausentes). Veja também software-carpentry.org .
Resposta
A coisa mais próxima é Cleveland” s Visualização de dados . É sobre Análise Exploratória de Dados, é sobre visualizações geradas por computador, é “profundo, é” um clássico.
Comentários
- O mesmo também se aplica ao livro Os elementos de dados gráficos do mesmo autor. Compre os dois; ambos são excelentes.
Resposta
Bem, não é uma réplica exata, mas encontrei toneladas de conselhos úteis de plotagem (e código R) em Gelman e Hill “s Análise de dados usando regressão e multinível / hierárquica Modelos
Além disso, seu blog costuma estar repleto de conselhos úteis sobre gráficos.
Resposta
Gráficos interativos para análise de dados: princípios e exemplos é o que eu gosto; a descrição do livro diz que “discute a análise exploratória de dados (EDA) e como os métodos gráficos interativos podem ajudar a obter insights, bem como gerar novas perguntas e hipóteses a partir de conjuntos de dados.”
Resposta
O livro ggplot2 de Hadley Wickham é interessante porque ensina gramática de gráficos e como usar o software ggplot2 .
Resposta
Ronald Pearson “s Explorando dados em engenharia, o Vale a pena mencionar aqui Ciências e Medicina . Seu público-alvo principal parece ser cientistas que não temem um pouco de matemática e desejam saber mais estatísticas. É um grupo bastante grande e bem representado aqui. É um pouco peculiar e incomum, mas cobre muito terreno e inclui muitos conselhos sensatos. Não é Tukey revisitado no sentido de que oferece muitas novas ideias, mas pode ser gratificante estudar, mesmo quando você pensa é um pouco equivocado.
Este livro parece ter atraído muito pouca atenção, possivelmente porque é muito caro, não é obviamente adequado como um texto de curso e, por enquanto, está disponível apenas em capa dura. Mas é inteligente e legível e livre do lixo dos livros didáticos introdutórios modernos (páginas e páginas de exercícios elementares, ícones bobos, fotos gratuitas de jovens felizes, layout complicado com caixas, o que for, etc.).
Resposta
Também Gráficos interativos e dinâmicos para análise de dados: com exemplos Usando R e GGobi, Cook e Swayne
Tem dois capítulos disponíveis publicamente na web que descrevem o processo de análise de dados e tratamento de valores ausentes. Em breve será lançado um novo livro de Antony Unwin.
Resposta
Outros livros bons para ler são Bela visualização e belos dados. Estes são livros editados, há exemplos incrivelmente bons de exploração de dados com plotagens e alguns capítulos absolutamente terríveis.
Outro livro que tem alguns bons exemplos de uso de ggplot2 é um novo de Winston Chang
Comentários
- Só quero verificar, Di, caso um erro de digitação sutil ocorra: você talvez quisesse escrever " atraente " em vez de " terrível "?Embora ambos façam sentido neste contexto, o aparecimento do último – sem qualquer explicação adicional – é bastante uma surpresa!
- espantoso estava correto – é uma mistura – os volumes editados frequentemente são
- Estou ' estou surpreso com essas recomendações. Eu achei os dois livros principalmente decepcionantes (muitas bobagens, poucas em gráficos). Infelizmente, O ' Reilly, que encontrei pela primeira vez como o editor de livros Unix espetacularmente bons, parece ter um controle de qualidade muito desigual para livros em qualquer coisa, mesmo remotamente estatística.
- Gosto de ambos os livros e realmente sinto que são contribuições substanciais. Winston Chang ' s tem muitos detalhes básicos sobre plotagem com ggplot2. É uma boa referência para iniciantes. Não diz muito sobre por que você faria esses enredos, mas a maioria faz sentido para o propósito, a partir dos textos que li. The Beautiful Visualization tem alguns capítulos muito impressionantes, abordando problemas difíceis como visualização de wikipedia, dados massivos, muitas complexidades, e passa pelo processo de pensamento / decisões tomadas para fazer os enredos.
- Apenas no caso de meu comentário ser ambíguo: eu estava me referindo aos livros " Bonitos ". O livro de Winston Chang ' é bom e útil.
Resposta
Eu penso em Entendendo a análise exploratória e robusta de Hoaglin, Mosteller e Tukey e o volume complementar em Explorando tabelas e formas de dados como o acompanhamento técnico para EDA. Também vejo análise e regressão de dados, um segundo curso em estatística por Mosteller e Tukey como acompanhamento para EDA. Os vários livros de Cleveland mencionados acima são tesouros.