통계2014.11.03 18:36

모평균의 신뢰구간 구하는법(σ를 모르는 경우)을 알아보자. 이전 포스팅에서는 σ를 아는 경우에 대해서 알아보았는데, 이번에는 σ를 모르는 경우에 대해서 알아보자. 사실 무엇인가를 조사할 때, 모표준편차(σ)와 같은 모집단의 모수를 아는 경우는 거의 없다. 그리고 기본적으로 모평균의 신뢰구간은 모평균을 모르기에, 모평균을 알기 위해 구간추정을 하는 것이다. 그런데 모평균을 모르면 모표준편차도 구할 수 없기에, 이전 포스팅과 같은 모평균을 모르는데 모표준편차인 σ를 아는 경우는 말도 안 되는 상황일 수 있다. 그래서 모평균의 신뢰구간은 σ를 아는 경우보다는 σ를 모르는 경우가 더 일반적이고 현실적이라서, 더 많이 쓰인다.

 

 

일단 모평균의 신뢰구간을 구할 때, σ를 아는 경우에는 정규분포를 사용한다고 했는데, 반대로 σ를 모르는 경우에는 t분포를 사용한다. 그리고 모표준편차인 σ를 모르기 때문에, σ 대신 표본표준편차 s를 사용한다. 그래서 정규분포 표준화 공식의 σs로 대체된다.

 

 

t분포를 사용해서 신뢰구간 구하는 방법도, 이전 포스팅의 정규분포와 같이 t분포 그래프를 사용해서 공식을 유도한다. 그래서 모평균의 신뢰구간(σ를 모르는 경우) 공식은 다음과 같이 된다.

 

 

그런데 t분포는 표본의 수(n)30개 이상이면 정규분포와 비슷해지기에, n30이면 t분포 대신 정규분포를 사용해도 된다. 그런데 이 부분이 헷갈릴 수도 있는데 그림으로 표현하면 다음과 같다. 그럼 몇 가지 문제를 풀어보자.

 

 

   

 

1. 어느 공장에서는 생산하는 제품의 모평균을 추리하기 위해 실험을 하는데, 실험을 위해 표본 9개를 추출하였다. 이 표본을 바탕으로 제품의 평균에 대한 95% 신뢰구간을 추정하시오.

20    20    25    21    21    23    19    18    22

일단 9개 표본의 평균과 표준편차를 알아야 하는데, 평균과 표준편차 계산법은 여기를 (참고)하면 된다. 그럼 표본평균 =21이고 표본표준편차 s=2.1213이 나온다. 그리고 신뢰수준이 95%이므로, α/2=0.025. 그리고 자유도가 n-1=9-1=8이므로, 해당 값을 t분포표()에서 찾으면 t값은 ±2.306이 된다. 공식을 사용해서 신뢰구간을 구해보면, 95% 신뢰구간은 19.369422.6306이 된다.

     

 

 

  

2. 어느 회사에서 제품의 모평균을 추정하기 위해 표본 30개를 뽑았는데, 표본의 평균 =400이고 표준편차 s=20이라고 한다. 이 제품의 평균에 대한 90% 신뢰구간을 추정하시오. (추가로 t분포를 사용해서 구한 값과 비교하시오.)

일단 표본이 30개 이상이므로 정규분포를 사용하자. 대신 σ를 모르기 때문에, σ 대신 표본표준편차 s를 사용한다. 신뢰수준이 90%이므로 α/2=0.05, Z값은 ±1.64가 된다. 신뢰구간을 구해보면 394.0116405.9884가 나온다.

 

 

이 문제를 t분포를 사용해서 구해보면, α/2=0.05이고 자유도 n-1=30-1=29라서 t값은 ±1.699가 된다. 그래서 신뢰구간은 393.7961 406.2039가 나오는데, 정규분포와 거의 비슷한 근삿값이 나오는 것을 알 수 있다.

 

 

그리고 t분포표를 분석해 보면 무한대()일 때의 t값이, 이전 포스팅에서 다루었던 정규분포의 90%, 95%, 99%의 Z값과 거의 흡사한 것을 알 수 있다. 그래서 n이 커질수록 t분포의 값은 점점 정규분포와 비슷해진다.

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. http://blog.naver.com/oroblast/220197000531
    짱!이에요~

    2014.12.01 11:15 신고 [ ADDR : EDIT/ DEL : REPLY ]
  2. 페라

    정말감사합니다. 말이필요업을정도로 감사합니다!

    2014.12.07 20:54 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. ㅇㅇㅇㅇㅇ

    표본수가 충분히 크다는 기준이 30정도였네요 ㅋㅋ 감사합니다

    2015.07.24 17:01 신고 [ ADDR : EDIT/ DEL : REPLY ]
  4. 최고에요!

    2016.01.09 18:18 신고 [ ADDR : EDIT/ DEL : REPLY ]
  5. 신입생

    와 진짜 정리 잘해놓으셨네요. 완전 이해 잘됩니다 감사해요 !

    2016.06.15 20:21 신고 [ ADDR : EDIT/ DEL : REPLY ]
  6. 안녕하세요

    모평균을 추정하는법은 알겠는데 모표준편차는 어떻게 추정하나요??

    2016.06.17 12:58 신고 [ ADDR : EDIT/ DEL : REPLY ]
  7. 질문요ㅠㅠ

    왜 신뢰수준 95센트에서 알파로 안하고 2/알파 로 하는이유를 모르겠습니다ㅠㅠㅠ

    2016.12.10 01:16 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 한쪽 방향만 할 때는 α

      양쪽 방향 모두 할 때는 α/2인데,

      신뢰구간은 양쪽 모두 다루기 때문에 α/2입니다.

      2016.12.11 15:26 신고 [ ADDR : EDIT/ DEL ]
  8. 질문

    대부분의 책도 표본수가 충분히 크다는 기준을 30으로 잡던데, 50도 100도 아닌30으로 잡는 이유가 있을까요...?

    2017.01.09 00:20 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 일단 표본의 수가 적을수록 "오차"가 매우 큽니다.(예를 들어 표본의 수가 1개라면, 오차가 매우 큽니다)

      그리고 표본의 수가 점점 많아질수록 "오차"도 점점 작아집니다.



      그런데 표본의 수가 30개 정도쯤 되면,

      이때부터는 "오차의 차이"가 그렇게 크지 않습니다.

      예를 들어 t분포표를 보면, 표본 29개나 표본 30개나 값의 차이는 크지 않습니다.

      그래서 그냥 기준을 30개로 잡았을 겁니다.



      하지만 이것도 "어떠한 실험"을 하느냐에 따라, 차이가 날 수밖에 없기에,

      표본은 되도록 많이 뽑을 수 있다면, 많이 뽑는 게 좋을 겁니다.

      2017.01.26 16:13 신고 [ ADDR : EDIT/ DEL ]
  9. 통계야

    안녕하세요~ 요즘 매일 들러서 통계 지식을 쌓고 있습니다~ 좋은글 감사합니다!!
    질문이 있는데요, σ을 모르는 경우에 t분포를 이용하는데, 표본이 다른 분포(카이제곱 등) 를 따르는 경우 다른 분포를 이용할 수 있는지요?

    2017.03.03 10:07 신고 [ ADDR : EDIT/ DEL : REPLY ]
  10. 수학과2학년 학생

    모분산 모르고 모집단이 정규분포를 따르지 않고 표본의 크기가 소집단일때는 t분포를 이용할 수 없지 않나요? t분포 정리에서 정규모집단을 가정하는걸로 알고있는데 위의 예제에서 크기9인 표본을 쓰셨는데 정규모집단이라는 가정이 없으면 안되지 않나요?? 궁금합니다.

    2017.10.20 13:00 신고 [ ADDR : EDIT/ DEL : REPLY ]