통계2014.09.01 16:53

분산을 구할 때 제곱을 하는 이유는 무엇일까? 이전 글에서 모집단의 분산은 σ2이고, 표본의 분산은 s2이라고 했었는데, 둘 다 제곱이 붙어 있다는 것을 알 수 있다. 실제로 분산을 구하는 공식을 보면, 공식에도 제곱이 붙어있다는 것을 알 수 있다. 그럼 분산을 구할 때, 제곱을 하는지 한 번 알아보자.

 


먼저 통계는 수학이라는 언어의 특성상 어느 정도 제약이 있는데, 일단 평균에서 데이터값까지의 거리를 편차라고 해보자. 그럼 데이터가 여러 개가 있을 때, 편차들의 합은 얼마일까?

 


그럼 편차의 합은 1+2+3+4=10이라는 것을 쉽게 알 수 있다. 그런데 수학적 계산으로는 10이라는 값이 나오지 않는다. 왜냐하면 수학이라는 언어의 특성상, 왼쪽 데이터들은 값을 가지기 때문이다.

 


그래서 편차의 합은 123+4=0이라는 말도 안 되는 값이 나온다. 그래서 원하는 값을 얻기 위해서는 값을 +값으로 바꾸어야 하는데, 그러한 방법의 하나가 바로 제곱(x2)이다.(122232+42  1+4+9+16) 그래서 편차들을 다 더하기 이전에, 제곱으로 값을 +값으로 바꾼 다음, 편차들의 합을 구한다. 이렇게 통계에서는 수학의 값이라는 특성 때문에, 분산을 구할 때 제곱을 한다.

 


그런데 데이터값을 제곱했기 때문에, 실질적인 편차의 치우침보다 더 큰 값이 나온다. 그래서 제곱된 값을 조절하기 위해서 루트를 사용하는데, 이러한 이유로 통계에서는 루트가 심심치 않게 나온다. 참고로 분산에 루트를 씌우면 표준편차가 된다.

 


Posted by 나부랭이

댓글을 달아 주세요

  1. 경영학도

    경영 통계 배우는 학생인데 진짜 이 블로그 사랑해요...ㅠㅠ ♡

    2014.10.19 10:21 [ ADDR : EDIT/ DEL : REPLY ]
  2. 지니가다가

    네이버로 검색하다가 우연히 들렸는데 즐찾하게 되네요!!
    정말 정리 이쁘게 하셨고 설명도 굿굿 짱이에요!!!
    감사합니다 정말 도움이 많이되요!!!
    자주 들릴게요!!

    2014.11.01 22:01 [ ADDR : EDIT/ DEL : REPLY ]
  3. 비밀댓글입니다

    2014.11.29 10:22 [ ADDR : EDIT/ DEL : REPLY ]
  4. goldenBBoy

    주인장님 사랑합니다. 너무 이해가 잘되요^^ 쏙쏚~

    2014.12.01 21:07 [ ADDR : EDIT/ DEL : REPLY ]
  5. Paul

    저 질문있는데요, 편차의 합은 항상 0이 되어야 하지 않나요?ㅠ

    2015.01.13 10:00 [ ADDR : EDIT/ DEL : REPLY ]
    • 제가 잠깐 헷갈렸네요 ~_~;;

      편차의 합은 0이 맞습니다.

      그리고 글은 수정했습니다.

      2015.02.12 14:37 신고 [ ADDR : EDIT/ DEL ]
  6. Mezzo

    대체 어떤 책을 찾아야 하나 에서 시작해 이 블로그로 오게되었네요. 너무 감사합니다.
    제 빈약한 통계 지식에 단비와 같은 블로그 입니다.

    정독하고 있습니다. 다시한번 감사합니다.

    2015.01.23 02:33 [ ADDR : EDIT/ DEL : REPLY ]
  7. sad

    근데 표준편차라는 정의는 각각의 편차에 절대값을 씌워서 총합을 구한다음 평균내는게 더 맞는 정의 아닌가요? 엔에 루트를 씌워서 나눠놓고 표준편차라 하는게 납득이 안가네요..

    2015.06.02 13:10 [ ADDR : EDIT/ DEL : REPLY ]
  8. 학교수업듣고 이해안되서 찾아봤는데 도움됬어요 감사ㅎ

    2015.07.30 19:59 [ ADDR : EDIT/ DEL : REPLY ]
  9. 게따

    감사합니다 ㅠㅠ

    2016.04.15 12:08 [ ADDR : EDIT/ DEL : REPLY ]
  10. 학생이에요

    저도 개념 이해가 잘 안될때 검색해보는데 이 블로그가 정말 도움 됐어요!!! 학기는 끝났지만 감사합니다

    2016.06.24 18:51 [ ADDR : EDIT/ DEL : REPLY ]
  11. 나불

    데이터가 음수값을 가지는 것을 막으려면 절댓값만으로도 충분한데 굳이 제곱하는 이유가 있을까요? 그리고 절댓값만 사용하면 값도 그리 커지지는 않을 듯 합니다.

    2016.09.15 10:52 [ ADDR : EDIT/ DEL : REPLY ]
    • 글쎄요..

      처음 만든 사람이 그냥 제곱을 해서,

      계속 제곱만 사용하는 것이 아닐까요?



      또 그 이후로 통계의 여러 많은 계산들이

      거의 다 제곱값을 사용하기 때문에,

      이제와서 바꾸기도 힘들고요.

      뭐 저도 확실하게는 모르겠네요~

      2016.09.25 17:22 신고 [ ADDR : EDIT/ DEL ]
  12. 456456

    진짜 속이 시원하네요 ㅜㅡㅜㅜ 진심으로 감사드립니다 ㅜㅜㅜㅜㅜㅜㅜ

    2017.10.03 12:53 [ ADDR : EDIT/ DEL : REPLY ]