나는 Tukey의 저서 “Exploratory Data Analysis”를 읽고 있습니다. 1977 년에 쓰여진이 책은 종이 / 연필 방법을 강조합니다. 이제 대규모 데이터 세트를 즉시 플로팅 할 수 있다는 점을 고려한보다 “현대적인”후속 작업이 있습니까?

댓글

  • 커뮤니티 위키 여야합니까?
  • 그것 ' 이것이 CW 여야하는지 확실하지 않습니다. 좋은 대답이 없을 수도 있습니다. 분명한 답이 하나있을 수 있습니다. 효과적인 답변의 긴 목록을 생성 할 수 있습니다. ' 무슨 일이 일어나는지 보겠습니다.
  • 좋은 질문입니다. 바이오 프리저. 나는 다른 작업 방법과 밀접한 유사점이 있음을 언급하고 싶었습니다. 제가 가장 좋아하는 것은 펜 & 종이 EDA는 현대적인 통계에 대한 것입니다. 손 도구는 현대적인 목공에 적용됩니다. (" 현대 " 목공은 탁자 톱 및 라우터와 같은 많은 전동 도구를 사용하여 초보자도 훨씬 짧은 시간에 적절한 결과를 얻을 수 있습니다. 그러나 , 이러한 도구는 매년 수천 개의 손가락과 팔다리를 잃어 버리는 원인이됩니다. 수공구 사용법을 배우는 사람들은 일반적으로 전동 공구를 사용해도 더 효율적이고 효율적으로 일하는 법을 배웁니다.)
  • 예, 목공은 좋은 비유 (누락 된 숫자, 누락 된 숫자). software-carpentry.org 를 참조하세요.

답변

가장 가까운 것은 Cleveland의 데이터 시각화 입니다. 탐색 적 데이터 분석에 관한 것입니다. 컴퓨터로 생성 된 시각화는 심오하고 고전적입니다.

댓글

  • The Elements 동일한 저자의 그래프 데이터 . 둘 다 구입하십시오. 둘 다 훌륭합니다.

답변

글쎄요, 정확한 복제본은 아니지만, Gelman and Hill의 회귀 및 다중 레벨 / 계층을 사용한 데이터 분석에서 유용한 플로팅 조언 (및 R 코드)을 많이 찾았습니다. 모델

또한 그의 블로그에는 유용한 그래픽 조언이 가득합니다.

답변

데이터 분석을위한 대화 형 그래픽 : 원리 및 예 는 내가 좋아하는 것입니다. 책 설명에는 “탐색 데이터 분석 (EDA)과 대화 형 그래픽 방법이 통찰력을 얻고 데이터 세트에서 새로운 질문과 가설을 생성하는 데 어떻게 도움이되는지에 대해 논의합니다.”라고 말합니다.

답변

Hadley Wickham의 ggplot2 책 은 그래픽의 문법과 ggplot2 소프트웨어 사용 방법을 모두 가르치기 때문에 흥미 롭습니다. .

답변

Ronald Pearson의 엔지니어링에서 데이터 탐색, 과학 및 의학 은 여기서 언급 할 가치가 있습니다. 그것의 주요 독자층은 더 많은 통계를 알고 싶어하는 작은 수학을 두려워하지 않는 과학자 인 것 같습니다. 그것은 꽤 큰 그룹이고 여기에 잘 표현 된 그룹입니다. “조금 기발하고 엉뚱하지만, 많은 근거를 다루고 있으며 많은 현명한 조언이 포함되어 있습니다. 많은 새로운 아이디어를 제공한다는 점에서 Tukey가 재 방문한 것은 아니지만, 생각할 때에도 공부하는 것은 보람이있을 수 있습니다. 그것은 약간 잘못된 것입니다.

이 책은 매우 비싸고 코스 텍스트로 적합하지 않고 아직 양장본으로 만 제공되기 때문에 거의 주목을 끌지 못한 것 같습니다. 그러나 그것은 지능적이고 가독성이 좋으며 현대 입문 교과서의 쓰레기가 없습니다 (초등 운동 페이지와 페이지, 어리석은 아이콘, 행복한 젊은이들의 무료 사진, 상자가있는 까다로운 레이아웃 등).

Answer

또한 데이터 분석을위한 대화 형 및 동적 그래픽 : 예제 포함 R 및 GGobi, Cook 및 Swayne 사용

여기에는 데이터 분석 프로세스와 결 측값 처리를 설명하는 두 개의 장이 웹에 공개되어 있습니다. Antony Unwin이 곧 출시 할 새 책이 있습니다.

답변

다른 몇 권의 좋은 책은

아름다운 시각화 및 Beautiful Data.이 책은 편집 된 책이며, 플롯을 사용하여 데이터를 탐색하는 놀랍도록 좋은 예가 있으며, 절대적으로 끔찍한 장이 있습니다.

다른 책 ggplot2 사용에 대한 몇 가지 좋은 예가있는 것은 Winston Chang

댓글

  • 미묘한 오타가 들어간 경우를 대비하여 Di, 다시 확인하고 싶습니다. " 흥미로운 " " 혐오 " 대신?두 가지 모두이 맥락에서 이해가되지만, 추가 설명없이 후자의 모습은 다소 놀랍습니다!
  • 놀라움은 맞았습니다 – 혼합 가방입니다 – 편집 된 책은 종종
  • '이 추천에 놀랐습니다. 나는 두 책 모두 대부분 실망 스러웠다 (긴 거프, 그래픽 부족). 불행히도 제가 놀랍도록 좋은 Unix 책의 출판사로 처음 만난 O ' Reilly는 원격 통계에서도 책에 대한 품질 관리가 매우 고르지 않은 것 같습니다.
  • 저는 두 책을 모두 좋아하며 실제로 상당한 기여를하고 있다고 생각합니다. Winston Chang ' s에는 ggplot2를 사용한 플로팅에 대한 많은 기본 세부 정보가 있습니다. 좋은 초보자 참고 자료입니다. 왜 이러한 플롯을 만들 었는지에 대해서는 많이 알려주지 않지만, 내가 읽은 조각에서 대부분의 목적에 대해 의미가 있습니다. Beautiful Visualization에는 위키피디아 시각화, 방대한 데이터, 많은 복잡성과 같은 어려운 문제를 해결하는 매우 인상적인 챕터가 있으며 플롯을 만들기 위해 취해진 사고 과정 / 결정을 거칩니다.
  • 내 의견이 모호함 : " 아름다운 " 책을 언급했습니다. Winston Chang '의 책은 훌륭하고 유용합니다.

답변

나는 EDA에 대한 기술적 후속 조치로 데이터 테이블 및 모양 탐색에 대한 동반자 인 Hoaglin, Mosteller 및 Tukey의 견고하고 탐색 적 분석 이해를 생각합니다. 또한 Mosteller와 Tukey의 두 번째 통계 과정 인 데이터 분석 및 회귀를 EDA에 대한 후속 조치로 봅니다. 위에서 언급 한 다양한 클리블랜드 책은 보물입니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다