私はテューキーの本「探索的データ分析」を読んでいます。 1977年に書かれたこの本は、紙と鉛筆の方法を強調しています。大規模なデータセットを瞬時にプロットできることを考慮に入れた、より「現代的な」後継者はいますか?
コメント
- これはコミュニティウィキである必要がありますか?
- それ' sこれがCWであるべきかどうかは私にはわかりません。良い答えはないかもしれません。明確な未解決の答えが1つあるかもしれません。効果的な回答の長いリストを生成する可能性があります。 'で何が起こるか見てみましょう。
- これは良い質問です、バイオフリーザー。他の作業方法と非常に類似していることを指摘したいと思います。私のお気に入りは、ペン&の紙のEDAは、手工具が現代の木工にあるように、現代の統計にあります。 ("現代の"木工は、テーブルソーやルーターなどの多くの電動工具を使用しており、初心者でも許容できる結果をはるかに短い時間で実現できます。 、これらのツールは、毎年何千もの数字や手足の欠落の原因にもなっています。ハンドツールの使用法を学ぶ人は、一般に、電動工具を使用している場合でも、より良く、より効率的に作業することを学びます。)
- はい、木工は素晴らしいアナロジー(数字の欠落、数字の欠落)。 software-carpentry.org も参照してください。
回答
最も近いのはクリーブランドのデータの視覚化 です。これは探索的データ分析に関するものであり、コンピューターで生成された視覚化、それは「深遠で、古典的」です。
コメント
- 同じことが本 TheElementsにも当てはまります。同じ作成者によるデータのグラフ化。両方を購入します。どちらも優れています。
回答
まあ、それは正確なレプリカではありませんが、GelmanとHillの回帰とマルチレベル/階層を使用したデータ分析で有用なプロットアドバイス(およびRコード)がたくさん見つかりましたモデル
さらに、彼のブログには、役立つグラフィックのアドバイスが満載されていることがよくあります。
回答
データ分析用のインタラクティブグラフィック:原理と例は私が好きなものです。この本の説明には、「探索的データ分析(EDA)と、インタラクティブなグラフィカル手法がデータセットから新しい質問や仮説を生成するだけでなく、洞察を得るのにどのように役立つかについて説明しています。」
回答
ハドリーウィッカムのggplot2ブックは、グラフィックスの文法とggplot2ソフトウェアの使用方法の両方を教えているので興味深いものです。 。
回答
ロナルドピアソンのエンジニアリングにおけるデータの探索、科学と医学はここで言及する価値があります。その主な対象読者は、より多くの統計を知りたいと願う小さな数学を恐れていない科学者のようです。それはかなり大きなグループであり、ここによく表されています。それは「少し風変わりで風変わりですが、多くの分野をカバーし、多くの賢明なアドバイスが含まれています。それは多くの新しいアイデアを提供するという意味でテューキーを再訪しませんが、あなたが考えても勉強することはやりがいがありますそれは少し間違っています。
この本はほとんど注目されていないようです。おそらく、非常に高価で、コーステキストとしては明らかに適していないため、ハードカバーでしか入手できないためです。しかし、それはインテリジェントで読みやすく、現代の入門教科書のゴミがありません(初歩的な演習のページとページ、愚かなアイコン、幸せな若者の無償の写真、ボックス付きのうるさいレイアウトなど)。
回答
またデータ分析用のインタラクティブで動的なグラフィック:例を使用RとGGobi、CookとSwayneの使用
これには、データ分析のプロセスと欠落値の処理について説明する2つの章がWeb上で公開されています。 「AntonyUnwinから間もなく出版される新しい本があります。
回答
もう2冊の良い本は
美しい視覚化と美しいデータ。これらは編集された本であり、プロットを使用してデータを探索する驚くほど良い例があり、いくつかの絶対にぞっとするような章があります。
別の本ggplot2の使用例がいくつかありますが、これは Winston Chang
コメント
- 微妙なタイプミスが入り込んだ場合に備えて、Diを再確認したいだけです。"魅力的な"<"恐ろしい"の代わりに/ div>?どちらもこの文脈では理にかなっていますが、後者の外観は、それ以上の説明なしに、かなり驚きです!
- 恐ろしいことは正しかったです-それは混合バッグです-編集されたボリュームはしばしばです
- 'これらの推奨事項に驚いています。私は両方の本がほとんどがっかりしていることに気づきました(ガフが長く、グラフィックが短い)。残念ながら、私が最初に見事に優れたUnixの本の出版社として出会った、O ' Reillyは、遠隔統計でさえ、本の品質管理が非常に不均一であるようです。
- 私は両方の本が好きで、それらがかなりの貢献であると本当に感じています。 Winston Chang 'には、ggplot2を使用したプロットに関する基本的な詳細がたくさんあります。初心者向けの参考になります。なぜこれらのプロットを作成するのかについてはあまり説明していませんが、私が読んだ部分から、目的にとって最も理にかなっています。 Beautiful Visualizationには、ウィキペディアの視覚化、大量のデータ、多くの複雑さなどの難しい問題に取り組む非常に印象的な章がいくつかあり、プロットを作成するために取られた思考プロセス/決定を通過します。
- 私のコメントがあいまい:"美しい"の本を参照していました。 Winston Chang 'の本は素晴らしくて役に立ちます。