통계2015.02.14 17:48

회귀계수의 신뢰구간 구하는 법을 알아보자. 일단 회귀분석의 메인테마는, 회귀식을 활용해서 무엇인가를 예측하는 것이다.(가능하면 예측구간을 설정해서, 구간으로 예측하는 것이 좋다) 그리고 추가로 결정계수와 가설검정을 통해 회귀식이 얼마나 잘 뽑혔는지를 검증하는 것까지가 중요하지, 신뢰구간 추정은 별로 중요하지 않다. 그냥 여러 책에서 종종 나오기에 다룰 뿐이다. 그냥 이런 것도 있다는 것만 알고 넘어가자.(예측구간이 있기 때문에, 신뢰구간의 필요성이 떨어진다)

 

 

먼저 모회귀식을 보면 y절편 β0와 기울기 β1이 있는데, y절편과 기울기를 편의상 회귀계수라고 부른다. 그래서 회귀계수의 신뢰구간은 y절편의 신뢰구간기울기의 신뢰구간을 구하는 것이다.

 

 

그런데 회귀분석은 y절편보다는 기울기를 더 중요시하는 경향이 있어서, 보통 기울기의 신뢰구간만 구한다.(사실 두 신뢰구간 모두 그닥 중요하지 않다) 그래서 여기서도 기울기의 신뢰구간만 다루려고 한다.

 

 

일단 신뢰구간은 표본의 통계량을 가지고, 모집단의 모수가 이럴 것이다라고 구간추정 하는 것이다. 그래서 모회귀식의 기울기 β1을 중심으로 공식이 유도되었다. 그리고 공식에는 오차제곱합(SSE)도 들어간다.

 

 

그리고 신뢰구간을 구할 때는 기본적으로 t분포를 사용하는데, 한 가지 주의할 것은 자유도가 n-2이다. 왜냐하면 회귀분석은 변수가 xy 이렇게 2개이기에, 각각의 변수에서 1을 하는 것이고, 그래서 최종적으로 2가 된 것이다.

 

 

추가로 표본의 수가 n30일 때는 정규분포를 사용할 수가 있다. 하지만 표본의 수가 30개 이상이면 손으로 계산하기가 힘들어서, 실질적으로 정규분포를 사용할 일은 거의 없다. 그럼 다음 글에서는 신뢰구간 문제풀이를 해보자.

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요