통계2015.01.14 19:10

상관분석이란 무엇일까? 일단 2개의 변수 xy가 있을 때, 이 두 변수가 서로 어떠한 관계에 있는지를 파악하는 경우가 종종 있다. 예를 들어보면,

(x)가 클수록, 몸무게(y)가 커지는지?

교육(x)을 많이 받을수록, 소득(y)이 커지는지?

광고(x)를 많이 할수록, 판매량(y)이 커지는지?

와 같이, 두 변수가 서로 어떠한 관계에 있는지를 파악하는 분석이 상관분석이다. 그리고 두 변수의 상관관계를 그림으로 표현할 수가 있는데, 몇 가지 예를 들면 아래와 같다.

 

 

 

 

 

 

위와 같이 상관분석은 그림으로 표현하는 것이 보기에 편한데, 그림을 보면 두 변수가 서로 어떠한 관계에 있는지를 파악할 수가 있다.(이러한 그림을 보통 산포도 혹은 산점도라고 부른다.) 그리고 x가 증가할수록 y도 증가하는 것을 (+)의 상관관계라고 부르고, 반대로 x가 증가할수록 y는 감소하는 것을 (-)의 상관관계라고 부른다.

 

 

그런데 상관분석에서 조심할 것이 하나 있는데, 상관분석은 서로가 어떠한 관계에 있는지는 파악할 수가 있지만, 서로의 인과관계는 파악할 수가 없다. 예를 들어 여름이 다가올수록 아이스크림은 점점 많이 팔린다. 또 여름이 다가올수록 모기가 점점 많이 생겨난다. 이 두 변수의 관계를 그림으로 나타내면 다음과 같은데,

 

 

문제는 아이스크림 때문에 모기가 많이 생겨난 것도, 모기 때문에 아이스크림이 많이 팔리는 것도 아니다. 즉 서로 직접적인 영향은 없다. 단지 또 다른 변수인 여름에 의해 아이스크림 판매량과 모기의 발생 수가 증가한 것이다.(물론 서로 직접적인 영향을 주고받는 경우도 있다.)

 

 

그래서 상관분석은 서로가 어떠한 관계에 있는지 상관관계는 파악할 수 있지만, 서로가 직접적인 영향을 주고받는지 인과관계는 파악할 수가 없다. 그러므로 그림의 결과를 곧이곧대로 해석하기보다는, 다른 변수의 가능성도 열어둔 체, 해석에 신중을 기할 필요가 있다.

Posted by 나부랭이

댓글을 달아 주세요

  1. 지랭이

    통계학 공부하는데 나부랭이님 포스트 항상 잘 보고 있습니다!!
    통계학 시험이 2주뒤에 있는데 혹시 회기분석에 대해서도 다뤄주시나요??

    2015.01.21 14:02 [ ADDR : EDIT/ DEL : REPLY ]
  2. 느티나무

    늘 쉽게 설명해 주셔서 고맙습니다,,^^

    2015.08.11 04:13 [ ADDR : EDIT/ DEL : REPLY ]
  3. 배트맨

    수포자도 이해 가도록 쉽게 설명을 잘해주시네요!
    너무 감사합니다~ ^^

    2016.02.10 23:24 [ ADDR : EDIT/ DEL : REPLY ]
  4. 호빵맨

    정말 감사합니다. 덕분에 잘보고 갑니다! 정리를 잘하셨네요! 인상적이에요 ^^

    2016.09.03 16:38 [ ADDR : EDIT/ DEL : REPLY ]
  5. jason

    와..... 저는 여태까지 서로 의미없는 두 변수들을 비교하는 줄 알고, "그럼 뭘 기준으로 ,(x,y)를 찍는거지?" 고민하고 있었는데..... 한 개의 대상에서 두 개의 데이터를 뽑아낸걸 비교하는 거였네요....

    모르는 거 잘 해결하고 갑니다 감사해요~!

    2016.09.29 11:40 [ ADDR : EDIT/ DEL : REPLY ]