통계2014.10.04 17:00

정규분포 그래프로 확률 구하는법을 알아보자. 이산확률분포들은 정수로 딱 셀 수 있기 때문에, 성공횟수와 실패횟수를 세서 횟수에 대한 확률을 구한다. 하지만 정규분포 같은 연속확률분포들은 정수로 딱 셀 수 없기 때문에(참고), 횟수에 대한 개념이 없다. 그래서 사건을 그래프로 산출하고, 그래프의 면적(넓이)으로 확률을 구하는 데, 그래프의 총면적은 확률 1이다. 왜냐하면, 확률의 총합은 1이기 때문이다. 그래서 정규분포 그래프의 총면적은 확률 1 or 100%이다.

            

그리고 정규분포의 대표적인 특징 중 하나는 바로 좌우대칭이라는 점인데, 평균을 중심으로 정규분포곡선을 반으로 접으면 서로 정확하게 겹친다. 그리고 이 절반의 면적은 확률 0.5 or 50%가 된다.

 

 

그런데 그래프의 면적을 구하기 위해서는, 해당 구간에 해당하는 x축 좌표를 알아야 하는데, x축 좌표는 어떻게 구할까? 정규분포의 x축 좌표는 보통 Z이라고 부르는데, Z값을 구하는 방법이 정규분포 공식을 사용해서 정규분포 표준화를 하는 것이다. 그래서 공식을 통해 Z값이 나오면 그에 맞는 확률을 구하는데, 몇 가지 예를 들어보면 다음과 같다.

 

            

 

        

이렇게 정규분포는 그래프의 면적 중 빗금친 부분의 면적이 확률이 된다. 물론 면적의 넓이를 어떻게 구할 것이냐?”의 문제가 있기는 하지만, 그 이전에 공식을 사용해서 x축 좌표인 Z값 구하는 법을 먼저 알아야 한다. 그래서 다음 포스팅에서는 Z값을 구하는 정규분포 표준화에 대해서 알아보자.

Posted by 나부랭이

댓글을 달아 주세요