통계2014.09.05 14:06

이산형 확률분포와 연속형 확률분포의 차이는 무엇일까? 통계에는 많은 종류의 확률분포가 있는데, 크게 이산확률분포와 연속확률분포로 나뉜다. 먼저 이산확률분포에는 베르누이분포, 이항분포, 다항분포, 초기하분포, 기하분포, 음이항분포, 포아송분포, 등이 있고, 연속확률분포에는 균등분포, 정규분포, 지수분포, 감마분포, 베타분포, t분포(티분포), 카이제곱분포, F분포 등이 있다.

 

그럼 이산형(discrete)과 연속형(continuous)의 차이는 무엇일까? 하나의 예를 들어, 한 남자 고등학교 2학년 학생을 대상으로 각 반에 안경 쓴 학생을 조사하였더니, 1반에는 13, 224, 311, 431, 5, 17명이 나왔다고 하자. 이렇게 13, 24, 11, 31, 17명처럼 정수로 딱 떨어져서 셀 수 있는 경우를 이산형이라고 한다.

ex) 각 반의 안경 쓴 학생의 수

 

이번에는 전교생의 키를 측정해서 키가 정확하게 172cm173cm인 학생의 수를 조사한다고 하자. 쉽게 구할 수 있다고 생각할 수 있겠지만, 이 조사는 불가능하다. 왜냐하면 현실에서는 소수점 단위가 있어서, 키가 정확하게 172cm173cm인 사람은 없다.

 

172.1002...cm

173.4729...cm

172.6847...cm

173.9002...cm

 

소수점 때문에 키가 정확히 172cm173cm인 사람을 구할 수가 없는데, 이렇게 정수로 딱 떨어지지 않아, 셀 수 없는 경우가 연속형이다. 연속형인 경우에는 셀 수 없기 때문에, 일정 구간을 설정하고 이 구간 안에 몇 명이 있느냐? 라는 방식으로 확률을 측정한다.

ex) 172cm 이상~173cm 이하인 학생의 수

 

확률변수도 확률분포와 마찬가지로 데이터의 특성에 따라, 크게 이산확률변수와 연속확률변수로 나뉜다.

Posted by 나부랭이

댓글을 달아 주세요