통계2015.02.02 19:34

회귀분석의 예측구간 문제풀이를 해보자. 일단 예측구간은 회귀식을 구하고, 특정 사례를 예측한 후에 설정하는 것이다. 그래서 별개의 문제를 처음부터 다루는 것보다는, 이전에 회귀분석 문제풀이에서 다루었던 문제를, 그대로 다루는 것이 훨씬 좋을 것 같다. 그래서 회귀분석 문제풀이에서 다루었던 문제의 예측구간을 구해보자.

 

 

 

 

1. 부모의 키가 클수록 자식의 키도 상대적으로 크다고 하는데, 아버지의 키와 아들의 키를 조사하였더니 아래와 같이 나왔다고 한다. 이 자료를 바탕으로 해서 회귀식을 구하였더니 y()=151.1+0.17x가 나왔고, 이 회귀식을 활용해서 아버지의 키가 165cm일 때, 아들의 키는 179.15cm가 될 것으로 예측하였다. 이때 아들의 키에 대해서, 90%의 예측구간을 설정하시오.

아버지의 키(x):     150     160     170     180     190

    아들의 키(y):     176     179     182     178     185

예측구간은 공식이 굉장히 복잡하므로, 많이 헷갈릴 수가 있다. 그리고 공식으로 한 번에 계산하기가 힘들기에, 들어가는 값들을 먼저 표로 나타내자.

 

그리고 해당 사례의 특정 값 y0()=179.15이고, x0=165이다. 그리고 신뢰수준이 90%이므로 α/2=0.05이고, 자유도는 5-2=3이다. 해당 값을 t분포표()에서 찾으면 tα/2=±2.353이 된다.

 

그래서 예측구간을 구하면 172.24186.06이 나온다. 그러므로 아버지의 키가 165cm일 때, 아들의 키는 172.24cm에서 186.06cm사이일 것이다.로 예측할 수 있다.

 

무엇인가를 예측할 때, “179.15cm일 것이다.는 맞을 확률이 거의 없다. 하지만 구간으로 설정해서 “172.24cm에서 186.06cm사이일 것이다.로 예측하면, 맞을 확률이 상당히 올라간다. 그래서 점추정보다는 구간추정으로 예측하는 것이 더 좋다.

 

 

 

2. 소득이 높을수록 신용카드사용량이 많아진다고 하는데, 월 소득 대비 신용카드 사용량을 조사하였더니 아래와 같이 나왔다고 한다. 이 자료를 바탕으로 해서 회귀식을 구하였더니 y()=-25.1+0.417x가 나왔고, 이 회귀식을 활용해서 월 소득이 250만 원일 때, 카드 사용량은 79.15만 원이 될 것으로 예측하였다. 이때 카드 사용량에 대해서, 95%의 예측구간을 설정하시오.(단위는 만원)

         월 소득(x):     100     200     300     400     500

카드 사용량(y):       30      57       76     140     197

 먼저 공식에 들어가는 값들을 표로 나타내야 하는데, 아래와 같다.

 

그리고 해당 사례의 특정 값 y0()=79.15이고, x0=250이다. 그리고 신뢰수준이 95%이므로 α/2=0.025이고, 자유도는 5-2=3이다. 해당 값을 표에서 찾으면 tα/2=±3.182가 된다.

 

그래서 예측구간을 구하면 16.64141.66이 나온다. 그러므로 월 소득이 250만 원일 때, 카드 사용량은 16.64만 원에서 141.66만 원 사이일 것이다.로 예측할 수 있다.

 

어디까지나 회귀분석의 메인테마는, 회귀식을 활용해서 무엇인가를 예측하는 것이다.(가능하면 예측구간을 설정해서, 구간으로 예측하는 것이 좋다) 그래서 이 부분에 무게를 두는 것이 좋다. 그리고 이후로 다룰 회귀분석 관련 글들은, 그냥 회귀식이 얼마나 잘 뽑혔는지를 검증하는 과정에 지나지 않는다.(모집단 추정도 한다) 단지 지루한 과정이다. 그럼 다음 글에서는 결정계수에 대해서 알아보자.

'통계' 카테고리의 다른 글

회귀식의 가설검정(분산분석) 개념정리  (32) 2015.02.10
결정계수란?  (13) 2015.02.05
회귀분석의 예측구간 문제풀이  (13) 2015.02.02
회귀분석의 예측구간 구하는 법  (0) 2015.02.01
회귀분석 문제풀이  (29) 2015.01.30
회귀식 구하는 법  (27) 2015.01.27
Posted by 나부랭이

댓글을 달아 주세요

  1. 다른책에 보니 기울기 b1 에 대한 신뢰구간 구하는 것도 있는데 이것도 다루어주심 감사드립니다

    2015.02.13 16:06 신고 [ ADDR : EDIT/ DEL : REPLY ]
  2. 박쥐

    자유도가 n-2인가요?? 다른글에서보니까 n-1이라고 하셨는데 ㅠㅠ 헷갈리네욥

    2016.05.05 23:16 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 감사합니다

    rㅏㅁ사합니다

    2016.10.25 02:57 신고 [ ADDR : EDIT/ DEL : REPLY ]
  4. 질문

    질문 하나 드려도 될까요?
    만약 95% 신뢰수준 예측 그래프로 나타낸다면
    정규분포 그래프에서 나타내야하는 것 맞나요?

    2016.11.07 11:16 신고 [ ADDR : EDIT/ DEL : REPLY ]
  5. 비누남자

    고맙습니다 좋은 공부가 되었습니다

    2017.02.20 21:28 신고 [ ADDR : EDIT/ DEL : REPLY ]
  6. 비밀댓글입니다

    2017.06.21 08:27 [ ADDR : EDIT/ DEL : REPLY ]