통계2015.01.26 20:14

회귀분석이란 무엇일까? 먼저 회귀분석은 상관분석이랑 비스무리한데, 그렇기에 상관분석의 연결 선상에서 이해하는 것이 좋다. 일단 이전 글들에서 상관분석은 두 변수가 서로 상관이 있는지를 파악하는 분석이라고 했다. 그리고 만약 두 변수가 서로 상관이 있을 때, 점들이 퍼져있는 모습을 보면 일정한 패턴에 모여있다고도 했었다.

 

 

그런데 이 일정한 패턴을 활용하면 무엇인가를 예측할 수가 있게 된다. 예를 들어 어느 한 회사가 광고를 5번 했을 때, 판매량은 몇 개일까?”를 조사한다고 할 때, 이 판매량을 예측할 수가 있다. 일단 점들이 모여 있는 일정한 패턴을 공식으로 바꿀 수가 있는데, 공식을 구해보니 y=50+30x가 나왔다고 하자. 그러면 광고를 5(x) 했을 때, 판매량(y)200개가 되는 것을 알 수 있다.

 

 

이렇게 점들이 퍼져있는 형태에서 일정한 패턴을 찾아내고, 이 일정한 패턴을 활용해서 무엇인가를 예측하는 분석이 회귀분석이다. 물론 이렇게 구한 값은, 단지 예측값으로 정답은 아니다. 하지만 무엇인가를 예측할 때, 눈대중으로 막 잡은 수치보다는 훨씬 신뢰할 만하다. 그리고 상관분석은 단순하게 두 변수가 서로 상관관계가 있는지만 파악했지만, 회귀분석은 상관분석에서 한발 더 나아가 무엇인가를 예측할 수 있기에, 상관분석의 업그레이드판이라고 생각해도 된다. 어쨌든 이 회귀분석을 사용하면 여러 상황을 예측할 수가 있는데, 몇 가지 사례를 들면 아래와 같다.

 

 

 

 

 

 

추가로 회귀분석에서 새로운 표본을 뽑았을 때, 이 표본은 전혀 별개의 값이 나오는 것이 아니라, 평균으로 돌아가려는 특성이 있다. 그래서 이름이 회귀분석이다.(回歸 돌 회, 돌아갈 귀) 그런데 새로운 표본이 평균으로 돌아가려는 특성이 있을 뿐, 돌아가려는 특성을 분석하지는 않는다. 그냥 무엇인가를 예측하는 예측기법이다. 그래서 분석이라는 이름은 어울리지 않는다.

 

 

어쨌든 회귀분석으로 무엇인가를 예측하기 위해서는 공식을 잘 뽑아내야 하는데, 이 공식을 보통 회귀식이라고 부른다. 그럼 다음 글에서는 회귀식 구하는 법을 알아보자.

'통계' 카테고리의 다른 글

회귀분석 문제풀이  (29) 2015.01.30
회귀식 구하는 법  (27) 2015.01.27
회귀분석이란?  (5) 2015.01.26
상관계수의 가설검정 문제풀이  (0) 2015.01.22
상관계수의 가설검정 개념정리  (4) 2015.01.21
상관계수 계산하는 법  (0) 2015.01.18
Posted by 나부랭이

댓글을 달아 주세요

  1. lucky

    안녕하세요 ㅎㅎ 어제부터 쭉 글 잘보고 있습니다.

    그런데, <추가로 회귀분석에서 새로운 표본을 뽑았을 때, 이 표본은 전혀 별개의 값이 나오는 것이 아니라, 평균으로 돌아가려는 특성이 있다. 그래서 이름이 “회귀”분석이다.(回歸 돌 회, 돌아갈 귀) 그런데 새로운 표본이 평균으로 돌아가려는 특성이 있을 뿐, 이 “돌아가려는 특성”을 분석하지는 않는다. 그냥 무엇인가를 예측하는 예측기법이다. 그래서 “회귀”분석이라는 이름은 어울리지 않는다.> 라는 부분에서,

    1. 새로운 표본이 평균으로 돌아가려는 특성이 있다는게.. 자료는 이미 존재하는 값이고 움직이지 않을 텐데 어떻게 돌아간다는 것이며

    2. "돌아가려는 특성"을 분석하지 않기 때문에 회귀분석이란 말이 딱 들어맞지 않는 것 같다고 말씀하셨는데 아마도 1번이 이해가 안가서 이 질문도 아직 이해가 잘 가지 않는 것 같습니다. 혹시 쉬운 설명 부탁드려도 될까요~?

    2015.12.09 19:59 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 1. 자료는 고정되어 있지 않습니다.

      더 뽑고자 한다면, 더 뽑아도 상관없습니다.

      오히려 자료를 더 뽑을 수만 있다면, 더 뽑는 것이 좋습니다.(정확도가 올라가기에)

      그런데 새로 뽑은 자료는, 전혀 별개의 값이 나오는 것이 아니라,

      평균 근처의 값이 나올 겁니다.(평균으로 돌아가려는 특성 때문에)




      2. 회귀분석은 어디까지나 "무엇인가를 예측하는 분석"입니다.

      그래서 이름을 붙이려면, 이 "무엇인가를 예측하는 분석"이라는 것을

      한눈에 파악할 수 있는 이름이 좋습니다.(돌아간다는 뜻을 지닌, "회귀" 말고요)

      2015.12.11 15:02 신고 [ ADDR : EDIT/ DEL ]
  2. lucky

    아~ 그렇군요 "무엇인가를 예측하는 분석"이란 이름이 더 적절한지에 대한 이해가 쏙 됐어요 ㅎㅎ

    대학원에서 통계 공부중인데 나부랭이님 블로그가 너무 큰 도움이 돼요 ㅠ_ㅠ 시간 나시면 꼭!

    통계 부분도 쭉쭉 업데이트 부탁드립니다!

    항상 수고해 주셔서 감사합니다! 너무너무 좋아요~!

    2015.12.14 14:01 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 지나가던나그네

    저는 회귀분석의 가장 큰 맹점은 여느 분석과 같이 미래를 예측할 수 없는 것이다라고 말하고 싶네요. 평균으로의 회귀 현상은 사실 당연한 것이지 않나요? 평균이라는 것 자체가 자료들을 총합해서 나눈 값인데 당연히 평균과 유사한 다음 값이 나오지 않나요? 애초에 다음 값이 극단적으로 올라갔더라면 평균 자체가 올라갔을 것이잖습니까 또한 회귀분석이라는 것도 결국은 기존의 데이터로 보았을 때 다음 값이 어떻게 될 것이다라는 가능성에 대한 추측이라서 새로운 극단적인 값의 등장을 예측하는 것은 불가능하다고 생각하네요. 사실 우리가 궁금한 건 이것인데 말이죠. 물론 불가능하다는 것은 압니다. 그리고 그렇다고 해서 회귀분석이 무의미하다는 것은 아니에요. 다만 뻔한 내용들을 사후예측하는 것 아닌가 하는 생각이 듭니다. 우리가 궁금한 것은 뻔하지 않은 내용인데. 물론 이것만으로도 충분히 통계적으로 유효성이 있다고는 생각을 해서 배워야한다고는 생각합니다.

    2017.06.06 16:10 신고 [ ADDR : EDIT/ DEL : REPLY ]