본문 바로가기

728x90
반응형

Statistics/데이터 과학을 위한 통계

(3)
[Practical Statistics for Data Scientists] 3 - 통계적 실험과 유의성 검정 이전 글 : 2022.08.03 - [데이터/데이터 과학을 위한 통계] - [Practical Statistics for Data Scientists] 2 - 데이터와 표본분포 지난 글에서는 데이터와 표본분포에 대해 공부하였다. 이번 포스트에서는 'Practical Statistics for Data Scientists' 교재의 109~164페이지의 통계적 실험과 유의성 검정에 대한 내용을 다룰 것이다. 코드 또한 필자의 깃허브에서 참조했으니 궁금한 독자들은 본문의 링크를 이용하길 바란다. 도서 페이지 : https://bit.ly/3zSetGu Index 3장 통계적 실험과 유의성 검정 추론 inference : 실험 결과를 더 큰 과정 또는 모집단에 적용하려는 의도 반영 통계 추론 과정 : 가설 수립..
[Practical Statistics for Data Scientists] 2 - 데이터와 표본분포 이전 글 : 2022.08.02 - [데이터/데이터 과학을 위한 통계] - [Practical Statistics for Data Scientists] 1 - 탐색적 데이터 분석 (EDA) 데이터의 질과 적합성을 일정 수준으로 담보할 수도 없으면서 데이터 크기만 늘어나는 것이 오늘날 상황이다. - p.67, - 필자 역시 빅데이터를 활용하게 되어 표본조사에서 전수조사로 트렌드가 바뀜에 따라 표본추출이 덜 중요해질 것이라 생각했다. 그러나 오히려 데이터 편향의 최소화, 다양한 유형의 테스트를 위한 표본추출의 중요성이 더 증대되고 있다는 것이 저자들, 피터 브루스 외 2인의 의견이다. 'Practical Statistics for Data Scientists' 교재 67~107페이지의 내용을 공부하며 보다 ..
[Practical Statistics for Data Scientists] 1 - 탐색적 데이터 분석 (EDA) 빅데이터 분석기사 필기를 준비하는 데 도움이 되고자 R로 'Practical Statistics for Data Scientists' 교재의 공부를 시작한다. 이 책은 우리말로는 '데이터 과학을 위한 통계'로 번역됐다. 코딩은 RStudio 22.07.1 버전으로 진행할 것이다. 교재에는 파이썬과 R 코드가 모두 적혀있기 때문에 어느 쪽을 써도 무방하다. 다만, 코드가 생략된 부분이 있기 때문에 완전한 코드를 확인하려면 저자의 깃허브를 확인하는 것이 좋다. 이번 포스트에서는 19~66페이지의 탐색적 데이터 분석에 대한 내용을 배울 것이다. 도서 페이지 : https://bit.ly/3zSetGu 존 투키의 1977년 저서로 EDA가 정립됨. 요약통계량 (평균, 중앙값, 분위수 등) + 도표 (상자그림 등..

728x90
반응형