Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 몰입 줄거리
- 책 추천
- 30대 필독
- 글로벌 MBA
- 목적 찾는 법
- 몰입하는 방법
- 오디오 텍스트 변환
- MBA 비용
- 청소년 추천 도서
- 30살 추천 도서
- 자기계발서 추천
- 블랙쉽
- 온라인 파트타임 MBA
- 받아쓰기 설정
- 장점 5가지
- 내 강점
- 내 장점 찾기
- 플로우 방법
- 강자의 언어
- 맥 받아쓰기
- 강점 5가지
- 몰입 책 후기
- 자신에게 할 질문
- 30대 필독서
- 20살 추천 도서
- 자산늘리는법
- 글로벌 MBA 비용
- mac 받아쓰기 설정
- 돈의 속성이란
- 자산 책 추천
Archives
- Today
- Total
Let's enjoy our life
[데이터 분석 기초] 분포의 종류 - 1분 개념 정리 본문
데이터 분석을 하면서 초반에 분포와 회귀방식이 헷갈렸었다 ^^; 통계 기초가 부족하다는 정체가 탄로난..
회귀 방식을 적용하는데 분포를 설정하는
1. 분포란?
그런데 대부분의 확률적 데이터값을 살펴보면 어떤 값은 자주 등장하고 어떤 값은 드물게 나오거나 나오지 않는 경우가 많다. 확률적 데이터에서 어떠한 값이 자주 나오고 어떠한 값이 드물게 나오는가를 나타내는 정보를 **분포(distribution)**라고 한다 [1].
확률변수 값/영역을 확률로 표현
분포는 범주형 데이터의 경우 카운트 플롯(count plot), 실수형 데이터의 경우 **히스토그램(histogram)**을 사용
-
표본평균, 표본중앙값, 표본최빈값
-
표본분산, 표본표준편차
-
표본왜도, 표본첨도
2. 분포의 종류 (이산&연속)
2.1. 이산확률분포
이산형 분포 ()
- 베르누이: 시행의 결과가 오직 두가지인 분포
- 이항분포: 베르누이 시행을 n번 할 때, 사건이 발행한 횟수를 확률변수 x로 하는 확률 분포
- 다항분포: 시행의 결과가 k개의 사건이고, 각 사건이 발생할 확률이 p1...pk일 때, n회의 시행에서 각 사건이 x1...xk일어날 확률분포
- 기하분포: 처음 성공이 나오기까지 시행한 횟수를 확률변수 x로 할 때의 확률분포 (각 시행은 베르누이)
- 음이항: 성공확률을 p라고 했을 때, r번의 실패가 나오기까지 발생한 성공 횟수가 확률변수 x인 확률분포 (역시 각 시행은 베르누이 수행)
- 초기하: 모
- 포아송: 단위 시간 안에 발생한 사건 횟수를 확률변수 x로 하는 확률분포 (이항분포에서 시행횟수가 무수히 많아지고, 발생확률은 아주 작은 경우)
2.2 연속형 분포 (연속확률변수 및 확률 분포 종류)
- 균등분포:
- 정규분포
- 지수 (포아송분포를 적분)
- 감마: 형태모수(shape parameter) α와 크기모수 β를 이용해 0 이상의 구간에 대한 다양한 확률분포
길냥이를 n번 마주칠 때 까지 걸린 시간이 t이하일 확률 - 베타
- 카이
- Student t
- F 분포
특정 구간 에서 어떤 값이 일어날 확률이 모두 같은 경우에 대한 분포특정 구간 에서 어떤 값이 일어날 확률이 모두 같은 경우에 대한 분포
참고
[2]
'Study' 카테고리의 다른 글
인공지능과 수학과의 관계 (0) | 2021.07.01 |
---|---|
엑셀 Vlookup 함수 가장 쉬운 이해 (0) | 2021.06.28 |
모수의 종류 (Types of Parameters) [빅 데이터 분석 기초] (0) | 2020.12.29 |
모수 (Parameter) 란? [빅 데이터 분석 기초] (0) | 2020.12.29 |
군집(Clustering)과 분류(Classification)의 차이 | 1초 개념 정리 - 빅 데이터 (0) | 2020.12.24 |
Comments