통계2015.01.30 18:57

회귀분석 문제풀이를 해보자. 회귀분석은 무엇인가를 예측할 때 사용하는 분석인데, 무엇인가를 예측하기 위해서는 먼저 회귀식을 구해야 한다. 그런 다음에 예측이 가능하다. 그런데 이 회귀식은 계산하기에는 손이 많이 간다. 그래서 계산하기 짜증나므로, 표본 수를 최소화하려고 한다. 그럼 몇 가지 문제를 풀어보자.

 


 

 

1. 부모의 키가 클수록 자식의 키도 상대적으로 크다고 하는데, 아버지의 키와 아들의 키를 조사하였더니 아래와 같이 나왔다고 한다. 이 자료를 바탕으로 해서 회귀식을 구하고, 아버지의 키가 165cm일 때, 아들의 키는 얼마인지 예측하시오.

아버지의 키(x):     150     160     170     180     190

    아들의 키(y):     176     179     182     178     185

일단 각 변수의 평균을 구해보면, x의 평균은 170이고 y의 평균은 180이 나온다. 그리고 기울기를 구해야 하는데, 기울기는 한 번에 계산하기가 힘들다. 그래서 들어가는 값을 먼저 표로 나타내자.

 

표를 활용해서 기울기를 구해보면 b1=0.17이 나오고, y절편은 b0=151.1이 나온다. 그래서 회귀식은 y()=151.1+0.17x가 되는 것을 알 수 있다.

 

회귀식을 구했으므로, 이제부터는 무엇인가를 예측할 수가 있다. 그래서 아버지의 키가 165cm일 때, 아들의 키는 151.1+0.17×165=179.15cm 정도라고 예측할 수 있다.(정답이 아니라 예측값이다.)

 

보통 상당수의 문제가 회귀식만 구하고 끝내는 경우가 많다. 하지만 회귀분석에서 회귀식을 구하는 이유는, 무엇인가를 예측하기 위해서이다. 그래서 회귀식을 구한 것으로 끝을 낼 것이 아니라, 이렇게 특정 값까지 예측해 보는 것이 좋다.(물론 회귀식이 얼마나 적합한지, 검증했다는 가정하에)

 

 

 

2. 소득이 높을수록 신용카드사용량이 많아진다고 하는데, 월 소득 대비 신용카드 사용량을 조사하였더니 아래와 같이 나왔다고 한다. 이 자료를 바탕으로 해서 회귀식을 구하고, 월 소득이 250만 원일 때, 신용카드 사용량을 예측하시오.(단위는 만원)

         월 소득(x):       100     200     300     400     500

카드 사용량(y):         30      57       76     140     197

일단 각 변수의 평균을 구해보면, x의 평균은 300이고 y의 평균은 100이 나온다. 그리고 기울기에 들어가는 값을 표로 작성하면 아래와 같다.  

 

표를 활용해서 기울기를 구해보면 b1=0.417이 나오고, y절편 b0=-25.1이 나온다. 그래서 회귀식은 y()=-25.1+0.417x가 되는 것을 알 수 있다.

  

회귀식을 구했으므로, 이제부터는 무엇인가를 예측할 수가 있다. 그래서 월 소득이 250만 원일 때, 카드 사용량은 -25.1+0.417×250=79.15만 원 정도라고 예측할 수 있다.

  

 

 

 

두 개의 문제를 통해서, 회귀식을 구하고 예측까지 해보았다. 그런데 예측은 어디까지나 예측일 뿐, 이 예측값이 맞을 확률은 거의 제로에 가깝다. 그래서 이 예측값만 가지고 무엇인가를 예상하기에는 한계가 있는 것도 사실이다. 그런데 만약에 값을 구간으로 설정한다면? 상황은 좀 달라질 것이다. 예를 들어 1번 문제의 답이 “175cm~185cm 사이일 것이다.라고 한다면, 이 회귀분석의 예측값은 훨씬 신뢰도가 올라갈 것이다.

 

 

그래서 통계에서는 이러한 점추정의 한계를 극복하기 위해서, 구간추정을 한다. 그리고 구간을 막 잡는 것이 아니라, 나름의 방법으로 신뢰할 수 있게 설정하는 데, 이렇게 설정된 구간을 신뢰구간이라고 한. 그런데 보통 회귀분석에서는, 신뢰구간보다는 예측구간이라고 부른다. 그래서 다음 글에서는 회귀분석의 예측구간에 대해서 알아보자.


저작자 표시 비영리 변경 금지
신고

'통계' 카테고리의 다른 글

회귀분석의 예측구간 문제풀이  (13) 2015.02.02
회귀분석의 예측구간 구하는 법  (0) 2015.02.01
회귀분석 문제풀이  (28) 2015.01.30
회귀식 구하는 법  (27) 2015.01.27
회귀분석이란?  (5) 2015.01.26
상관계수의 가설검정 문제풀이  (0) 2015.01.22
Posted by 나부랭이

댓글을 달아 주세요

  1. 비밀댓글입니다

    2015.05.09 02:49 [ ADDR : EDIT/ DEL : REPLY ]
    • 일단 발표는 전체적인 논리(스토리)가 중요한데,

      회귀분석은 "무엇인가를 예측"할 때 사용하는 도구이기에,

      이 "무엇인가를 예측"한다는 내용으로, 전체적인 논리를 만들면 좋을 것 같네요.



      그리고 그 외에 필요 없는 부분은 다 빼버리는 게 좋을 겁니다.

      왜냐하면 필요 없는 내용이 많으면, 논리가 지저분해집니다.

      (보통 대부분의 발표가 지겹고, 이해가 안 되는 이유는, 논리가 지저분해서입니다.)

      2016.02.26 12:23 신고 [ ADDR : EDIT/ DEL ]
  2. 이런거 안쓰는데..ㅋ 덕분에 잘 이해하고 갑니다^^
    고마워요~

    2015.06.10 23:23 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 철인28호

    정말 정말 정말 감사합니다. 회귀분석이 무엇인지 정확하게 알았습니다. 좋은 자료 정말 감사합니다.^^

    2015.07.15 21:10 신고 [ ADDR : EDIT/ DEL : REPLY ]
  4. 비밀댓글입니다

    2016.02.05 20:33 [ ADDR : EDIT/ DEL : REPLY ]
  5. 비밀댓글입니다

    2016.02.14 02:54 [ ADDR : EDIT/ DEL : REPLY ]
    • 왜 b0값을 0으로 하는지는 저도 모르겠네요.

      단지 b0를 0으로 고정하면, 최종값이 달라지므로,

      이것을 해결하기 위해, b1값이 변하는 걸 겁니다.

      2016.02.18 12:21 신고 [ ADDR : EDIT/ DEL ]
  6. 똘멩이

    광학센서쪽 프로그래머로 일하고 있습니다.

    센서의 샘플링 데이터를 엑셀의 로그 추세선으로 돌려 보면 R값이 0.997까지 나오길래...
    도대체 추세선 알고리즘이 뭔가하고 구글링을 하다가 보니 이곳까지 들어 오게 되었네요...

    어떤 지식이든지 잘 이해를 하는 능력과 잘 설명하는 능력은 별개라고 들었는데
    이곳에 와서야 선형 회귀분석의 기본개념에 대하여 이해를 하게 된 것을 보니
    님의 설명 능력이 탁월 하신 것 같습니다.

    모두 이해를 한 것은 아니지만 제가 무엇을 모르고 있고 무엇을 공부를
    더 해야 하는지는 조금씩 알 것 같습니다.

    암튼 일면 면식은 없지만 님의 지식나눔에 깊은 감사를 드립니다.

    2016.02.25 15:30 신고 [ ADDR : EDIT/ DEL : REPLY ]
  7. 열공녀

    안녕하세요, 통계 포스팅을 통해서 많은 도움 받고있는 1인입니다.

    쏙쏙 이해되도록 잘 설명해주셔서 재미있게 공부하고 있습니다.

    이번 포스팅을 보면서 질문이 생겼는데요,

    회귀식이 적합한지 검증하기 위한 방법을은 어떤게 있을까요?

    2016.08.29 15:58 신고 [ ADDR : EDIT/ DEL : REPLY ]
  8. 수학소녀

    안녕하세요 이 글을 통해 정말정말 많은 도움 받고있는 대학생입니다.
    학교수업이 이해가안되서 힘들어하고 있었는데 여기만 오면 이해가 쏙쏙 잘되네요 ㅎㅎ
    덕분에 많이 알아갑니다~ 감사드립니다!!!!

    2016.10.13 20:14 신고 [ ADDR : EDIT/ DEL : REPLY ]
  9. 비밀댓글입니다

    2016.12.16 22:12 [ ADDR : EDIT/ DEL : REPLY ]
    • 연도는 그냥 "기간"일 뿐, "변수"는 아닐 겁니다.

      그래서 회귀분석은 안 될 거 같은데요~

      2016.12.17 14:40 신고 [ ADDR : EDIT/ DEL ]
  10. 비밀댓글입니다

    2017.04.13 11:23 [ ADDR : EDIT/ DEL : REPLY ]
  11. NEXTCRO

    글 원래 잘 안남기는데 여기 티스토리 보고 엄청 도움 많이 받고 있습니다. 감사합니다 항상 행복하세요

    2017.04.17 10:53 신고 [ ADDR : EDIT/ DEL : REPLY ]
  12. suwon

    정말 정말 설명 잘하세요 ㅠㅠ 예시도 계산이 딱 떨어져서 복잡한 계산하느라 허비하는거 없이 개념만 딱 간결하게 파악하는데 도움이 됩니다. 정말 감사합니다!

    2017.04.23 23:35 신고 [ ADDR : EDIT/ DEL : REPLY ]
  13. 비밀댓글입니다

    2017.05.09 11:56 [ ADDR : EDIT/ DEL : REPLY ]
  14. 지나가다

    써주신 글 감사하게 잘 읽으면서 간만에 학부 때 공부하던 내용 리뷰 하고 있습니다.

    하나 확인해주셨으면 하는 부분이 게시물 처음에 b1 유도과정에서 오타가 있는거 같습니다

    (x-x(평균))^2 으로 쓰셨을 거 같은데 내용이 (x - x)^2로 나와있네요 ^ ^;;

    2017.06.11 18:55 신고 [ ADDR : EDIT/ DEL : REPLY ]
  15. 갓갓갓

    와 예시까지 여러개 들어주셔서 이해하기 쉽네여. 한번 쭉 정독하다가 댓글남겨요! 감사합니당

    2017.10.18 12:33 신고 [ ADDR : EDIT/ DEL : REPLY ]