본문 바로가기

728x90
반응형

Statistics

(5)
[통계] 메타코드M '통계 기초의 모든 것' 공부 후기 (2/2) 지난 시간에 이어 메타코드M의 '통계 기초의 모든 것' 강의를 정리해보도록 하겠다. 이전글은 아래의 링크를 참조바란다. 메타코드M 빅데이터 , AI 강의 플랫폼 & IT 현직자 모임 플랫폼ㅣ메타코드 커뮤니티 일원이 되시기 바랍니다. mcode.co.kr 2024.01.22 - [Statistics] - [통계] 메타코드M '통계 기초의 모든 것' 공부 후기 (1/2) Index 통계 기초의 모든 것 1. 이산확률분포 베르누이 시행: 사상이 2개인 시행 (ex.성공 or 실패) 이항확률분포: 베르누이 시행을 반복하여 특정 횟수의 성공 or 실패가 나올 확률. n: 시행횟수, p: 성공 확률 기댓값: np 분산: np(1-p) 포아송분포: 단위시간, 단위공간 내 어떤 사건이 발생하는 횟수를 나타낸 확률분포 ..
[통계] 메타코드M '통계 기초의 모든 것' 공부 후기 (1/2) 빅데이터 분석기사 취득 후 데이터 공부를 하지 않아 안타깝게도 대부분의 지식이 유실되었다. 이 비극적인 상황에서 벗어나고자 '메타코드M'의 힘을 빌리기로 결심했다. '메타코드M'에 올라온 많은 유익한 강의들을 보며 데이터에 대한 기초를 다시 쌓고 나아가 업무 역량을 키우고자 한다. 데이터 분석의 기초는 통계라고 할 수 있는만큼 먼저 기본적인 통계 이론을 짚어볼 것이다. Index '메타코드M'이란? 먼저 '메타코드M'이 무엇인지 소개하고 본론으로 들어가도록 하겠다. '메타코드M'은 데이터, 코딩 등의 강의를 제공하는 플랫폼이자 관련 산업에 발을 내디딜 수 있도록 취업 정보, 업계 지식 등을 공유하는 커뮤니티이기도 하다. 필자는 유튜브에서 처음 접했는데 유익한 영상들이 많이 나와 조금씩 보다가 강의를 보고..
[Practical Statistics for Data Scientists] 3 - 통계적 실험과 유의성 검정 이전 글 : 2022.08.03 - [데이터/데이터 과학을 위한 통계] - [Practical Statistics for Data Scientists] 2 - 데이터와 표본분포 지난 글에서는 데이터와 표본분포에 대해 공부하였다. 이번 포스트에서는 'Practical Statistics for Data Scientists' 교재의 109~164페이지의 통계적 실험과 유의성 검정에 대한 내용을 다룰 것이다. 코드 또한 필자의 깃허브에서 참조했으니 궁금한 독자들은 본문의 링크를 이용하길 바란다. 도서 페이지 : https://bit.ly/3zSetGu Index 3장 통계적 실험과 유의성 검정 추론 inference : 실험 결과를 더 큰 과정 또는 모집단에 적용하려는 의도 반영 통계 추론 과정 : 가설 수립..
[Practical Statistics for Data Scientists] 2 - 데이터와 표본분포 이전 글 : 2022.08.02 - [데이터/데이터 과학을 위한 통계] - [Practical Statistics for Data Scientists] 1 - 탐색적 데이터 분석 (EDA) 데이터의 질과 적합성을 일정 수준으로 담보할 수도 없으면서 데이터 크기만 늘어나는 것이 오늘날 상황이다. - p.67, - 필자 역시 빅데이터를 활용하게 되어 표본조사에서 전수조사로 트렌드가 바뀜에 따라 표본추출이 덜 중요해질 것이라 생각했다. 그러나 오히려 데이터 편향의 최소화, 다양한 유형의 테스트를 위한 표본추출의 중요성이 더 증대되고 있다는 것이 저자들, 피터 브루스 외 2인의 의견이다. 'Practical Statistics for Data Scientists' 교재 67~107페이지의 내용을 공부하며 보다 ..
[Practical Statistics for Data Scientists] 1 - 탐색적 데이터 분석 (EDA) 빅데이터 분석기사 필기를 준비하는 데 도움이 되고자 R로 'Practical Statistics for Data Scientists' 교재의 공부를 시작한다. 이 책은 우리말로는 '데이터 과학을 위한 통계'로 번역됐다. 코딩은 RStudio 22.07.1 버전으로 진행할 것이다. 교재에는 파이썬과 R 코드가 모두 적혀있기 때문에 어느 쪽을 써도 무방하다. 다만, 코드가 생략된 부분이 있기 때문에 완전한 코드를 확인하려면 저자의 깃허브를 확인하는 것이 좋다. 이번 포스트에서는 19~66페이지의 탐색적 데이터 분석에 대한 내용을 배울 것이다. 도서 페이지 : https://bit.ly/3zSetGu 존 투키의 1977년 저서로 EDA가 정립됨. 요약통계량 (평균, 중앙값, 분위수 등) + 도표 (상자그림 등..

728x90
반응형