중3수학2018.04.19 18:30

분산과 표준편차 구하는 법을 알아보자. 먼저 통계의 수치를 얻기 위해서, 어떠한 현상을 조사한 후, 해당 데이터를 숫자로 나타내면, 데이터값들은 제각각으로 흩어져 있다는 것을 알 수 있다. 그런데 어떠한 경우에는 데이터값들의 흩어져 있는 격차가 작은 반면, 어떠한 경우에는 데이터값들의 흩어져 있는 격차가 크다.

 


그런데 통계에서는 데이터값들이 얼마나 흩어져 있는지를 파악하기도 하는데위에서처럼 그림만으로 파악하기에는 한계가 있다.(통계에서는 데이터들의 흩어져 있는 격차를 분석하고 관리하는 역할도 한다) 그래서 추가로 숫자를 사용해서 흩어져 있는 정도를 나타내는데, 데이터값들이 흩어져 있는 정도를 숫자로 나타낸 것이 바로 분산표준편차.(분산과 표준편차가 0에 가까울수록, 데이터값들이 흩어져 있는 정도는 작다고 볼 수 있다) 그리고 분산을 구하려면, “편차 제곱의 합 / 데이터의 개수를 하면 된다.(분산은 편차 제곱의 평균이다)

 


참고로 얼마나 흩어져 있는지를 알기 위해서는, 기준이 되는 기준점이 필요한데, 보통 기준점으로는 이전 글에서 다루었던 평균을 많이 사용한다. 그리고 각 데이터값이 평균에서 떨어져 있는 정도편차라고 부른다.

 


예를 들어 각 데이터값이 72, 70, 69, 73, 66, 70이라고 해보자. 그럼 편차 = 각 데이터 값 평균으로 구할 수 있는데, 해당 데이터값의 평균을 구해보면 70이 나오므로, 각각의 편차를 구해보면 아래와 같이 나온다.

 


그다음 각각의 편차를 제곱한 후 모두 더해보자.(수학의 특성상 평균에서 왼쪽이나 아래쪽에 위치한 데이터값들은 가 붙는다. 그래서 를 없애기 위해서 제곱을 하는 것이다.(참고)) 그러면 편차 제곱의 합은 4+0+1+9+16+0=30이 나오는데, 마지막으로 데이터의 개수로 나눠주면 분산은 5가 나온다.

 


그런데 편차를 제곱했기 때문에, 실질적인 편차의 크기보다 더 큰 값이 나온다. 그래서 제곱된 값을 조절하기 위해서 루트를 사용하는데, 분산에 루트를 씌워서 나온 값이 바로 표준편차.(양의 제곱근만 구하면 된다) 그래서 분산이 5이면, 표준편차는 루트5가 나온다.



Posted by 나부랭이

댓글을 달아 주세요