통계2014.09.01 17:57

분산과 표준편차 의미는 무엇일까? 일단 이전 글에서 분산과 표준편차는 치우침을 표현하는 통계의 대표적인 기호들인데, -값 때문에 표준편차가 있는데도 분산을 사용한다고 했다. 그런데 구체적으로 분산과 표준편차의 의미는 무엇일까? 먼저 분산의 의미를 알아보자. 일단 문제 하나를 예로 들어, 4개의 수 50, 60, 70, 80의 평균은 얼마일까?

 

 

 

평균은 65가 나오는 것을 쉽게 알 수 있다. 갑자기 웬 평균이냐고 말할 수도 있겠지만, 분산을 이해하기 위해서는 먼저 평균을 알아야 한다. 왜냐하면 분산은 평균이기 때문인데, 바로 편차 제곱의 평균이다. 다음과 같이 편차가 4개 있다고 하자.

 

위의 데이터를 가지고 편차 제곱의 평균을 구해보면,

 

 

 

7.5라는 값이 나온다. 그런데 이 평균은 편차 제곱의 평균으로, 이것이 바로 분산이다. 그림으로 표현하면 아래와 같다.(보통 분산을 구할 때 n-1로 나누는 경우가 많)

 

 

그런데 분산은 제곱된 값이기 때문에, 실질적인 치우침에 비해 그 값이 크다. 그래서 루트를 사용하여 값을 조절하는데, 이 루트를 사용하여 조절된 값이 표준편차다. 표준편차는 루트분산이다. 참고로 아래의 그림을 보면, 표준편차 바로 전 단계가 분산인 것을 알 수 있다. 분산을 구해야만 표준편차도 구할 수 있다는 소리다.

 

 

Posted by 나부랭이

댓글을 달아 주세요

  1. '-'도 제곱해야지요~~

    2015.09.09 12:15 신고 [ ADDR : EDIT/ DEL : REPLY ]
  2. 도움짱

    분산구할때 -제곱해주는거빼고는, 완전 깔끔하고 이해 쏙쏙되는 설명!!
    이런 설명 찾고있었는데 감사합니다!

    2016.05.01 13:06 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 카르마

    좋습니다...
    잘 보고 갑니다
    가장 간단하고
    알아보기 쉽게 설명한 듯이 보입니다
    추천드림!

    2016.10.19 13:30 신고 [ ADDR : EDIT/ DEL : REPLY ]
  4. 헥헥

    '편차제곱합의 평균'은 전부
    '편차제곱의 평균'으로 수정하셔야 할 듯~

    2016.11.30 04:20 신고 [ ADDR : EDIT/ DEL : REPLY ]
  5. 회색나무

    늦게 통계를 공부하고 있습니다.
    블로그 내용이 큰 도움이 되고 있습니다.
    근데 윗분 글에서 편차제곱의 평균으로 수정하라고 되어있고 실제 그렇게 수정되었는데
    편차제곱합의 평균이 맞는표현 아닌가요?
    갑자기 헷갈립니다,

    2017.10.01 17:57 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 약간 헷갈릴 수도 있는데,

      "편차제곱합"은 평균을 구하기 위한 과정입니다.

      그래서 "편차제곱의 평균"이 맞습니다.

      2017.10.10 12:08 신고 [ ADDR : EDIT/ DEL ]
  6. 꾸벅봇

    너무감사합니다!!

    2017.10.12 14:55 신고 [ ADDR : EDIT/ DEL : REPLY ]
  7. wave&swell

    깔끔한 설명이었습니다. 감사합니다.

    2018.01.09 08:46 신고 [ ADDR : EDIT/ DEL : REPLY ]