통계2015.01.27 20:19

회귀식 구하는 법을 알아보자. 먼저 통계는 책마다 사용하는 기호가 달라서 좀 짜증나는 부분이 있는데, 유독 회귀식은 그 정도가 심하다. 그래서 회귀식을 표현하는 기호는 여러 가지가 있는데, 어차피 뜻은 동일하다. 그리고 보통 a+bx가 가장 단순하고 익숙해서 많이 사용되지만, 이 기호는 다중회귀분석이랑 궁합이 안 좋다. 그래서 여기서는 b0+b1x로 사용하려 한다.

 

 

일단 이전 글에서 회귀분석은 두 변수가 만들어내는 일정한 패턴을 활용해서, 무엇인가를 예측할 때 사용한다고 했었다. 그런데 예측은 어디까지나 예측일 뿐, 정답이 아니다. 그래서 결과 값인 y에는 ^이 들어간다.(표본으로 얻어낸, 결과가 이럴 것이다.라고 추리한 예측값)

 

그리고 위의 회귀식을 보면 y절편인 b0와 기울기인 b1이 있는데, 이 값들을 알아야 무엇인가를 예측할 수가 있게 된다. 그래서 직접 구해야 하는데, 회귀분석은 기울기를 알아야 y절편을 구할 수 있으므로, 보통 기울기인 b1을 먼저 구한다. 그리고 구할 때는 최소제곱법(최소자승법이라고도 한다.)을 사용하는데, 구하는 공식은 아래와 같다.

 

 

그리고 기울기를 구했다면 이제는 y절편을 구할 수가 있는데, 한 가지 문제는 일차함수에서 y절편 구하는 법이랑 조금 다르다. 보통 일차함수에서는 x0을 대입해서 y절편을 구하지만, 회귀분석은 이렇게 구할 수가 없다.

 

 

왜냐하면 회귀분석은 기본적으로 표본을 데이터로 뽑아서 사용하기에, x=0인 상황을 만들기가 힘들다. 그래서 x=0으로는 y절편을 구하지 못한다. 추가로 표본을 기본바탕으로 사용하기에, 일차함수와는 달리 값도 안 다루는 것이다.

 

 

그런데 가끔 x=0이 가능한 경우도 있다. 하지만 그렇다고 해도 x0을 대입해서 y절편을 구하면 안 된다. 왜냐하면 각 데이터마다 편차가 다르기 때문이다. 만약 x=0으로 y절편을 구한다면, 이것은 하나의 표본(x=0)만을 기준으로 해서 구한 꼴이 된다.

 

 

어쨌든 y절편을 구할 때는 표본의 모든 데이터를 기준으로 해서 구하는 것이 좋은데, 이렇게 하는 방법의 하나가 바로 각 변수의 평균을 사용하는 것이다. 그래서 y절편은 각 변수의 평균을 사용해서 구한다.

 

 

어쨌든 y절편 b0와 기울기 b1을 구하면 회귀식이 완성되고, 이때부터는 무엇인가를 예측하는 예측기법으로 사용할 수가 있다.(얼마나 적합한지, 검증했다는 가정하에) 그럼 다음 글에서는 직접 회귀식을 계산해보자.

'통계' 카테고리의 다른 글

회귀분석의 예측구간 구하는 법  (0) 2015.02.01
회귀분석 문제풀이  (29) 2015.01.30
회귀식 구하는 법  (27) 2015.01.27
회귀분석이란?  (5) 2015.01.26
상관계수의 가설검정 문제풀이  (0) 2015.01.22
상관계수의 가설검정 개념정리  (4) 2015.01.21
Posted by 나부랭이

댓글을 달아 주세요

  1. 웬만한 통계책보다 이해하기 쉽게 써주시네요ㅎ 잘봤습니다!

    2015.01.29 10:48 신고 [ ADDR : EDIT/ DEL : REPLY ]
  2. 요코하마

    드디어 회귀분석도 다뤄주셨군요! 요번 학기 통계학 시험범위랑 딱 겹처서 정말 많은 도움되네요!! 감사합니다

    2015.01.30 02:07 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 손홍곤

    최소제곱법 먼가 새롭네요

    2015.02.03 15:25 신고 [ ADDR : EDIT/ DEL : REPLY ]
  4. 님쫭

    책내세요~~ 통계학의정석은어떤가요 ㅋㅋ

    망할교수래미들 고딩때보다 글자체가 축소되고 이해과정이 너무 줄여드는것을 보면..

    2015.02.21 16:07 신고 [ ADDR : EDIT/ DEL : REPLY ]
  5. somin

    정말...ㅋㅋㅋ 통계학의 정석 책 내시는게 어떤지.. 수업들을땐 하나도 이해 안되는게 글 한방으로 다 이해가 되네요. 짱짱!!

    2016.03.11 15:28 신고 [ ADDR : EDIT/ DEL : REPLY ]
  6. 구데기

    감사합니다. 많이 배워갑니다.

    2016.05.30 21:36 신고 [ ADDR : EDIT/ DEL : REPLY ]
  7. 통계썡초보자

    우선 나부랭이님께 진심으로 감사올립니다. 덕분에 통계가 재미있어졌습니다. 감사합니다.

    2016.06.07 11:45 신고 [ ADDR : EDIT/ DEL : REPLY ]
  8. 통계썡초보자

    우선 나부랭이님께 진심으로 감사올립니다. 덕분에 통계가 재미있어졌습니다. 감사합니다.

    2016.06.07 11:45 신고 [ ADDR : EDIT/ DEL : REPLY ]
  9. rt

    감사합니다

    2016.08.18 00:48 신고 [ ADDR : EDIT/ DEL : REPLY ]
  10. 01

    잘 보고 갑니다. 큰 도움 되었어요!

    2016.12.05 16:26 신고 [ ADDR : EDIT/ DEL : REPLY ]
  11. 사랑해요 나부랭이님!

    2016.12.08 20:12 신고 [ ADDR : EDIT/ DEL : REPLY ]
  12. 히포

    좋은 글 덕분에 제가 가지고 있던 문제점 발견했습니다^^!! 감사합니다

    2017.02.20 15:18 신고 [ ADDR : EDIT/ DEL : REPLY ]
  13. 감사합니다.

    나부랭이님 덕분에 공부가 재미있어졌습니다. 40대 직장인입니다. 감사합니다.

    2017.03.08 08:27 신고 [ ADDR : EDIT/ DEL : REPLY ]
  14. 박민서

    회귀곡선이랑 같은말이죠?

    2017.06.27 20:21 신고 [ ADDR : EDIT/ DEL : REPLY ]