통계2014.11.05 14:32

모평균의 신뢰구간 표본크기 결정에 대해서 알아보자. 무엇인가를 조사할 때 표본의 크기(n)가 크면 데이터의 신뢰도도 커지고, 반대로 표본의 크기가 작으면 데이터의 신뢰도도 작아진다. 그래서 아무리 신뢰구간(신뢰할 수 있는 구간)이더라도 표본의 크기가 너무 작으면 구간의 신뢰도도 작아진다. 그렇다고 신뢰도를 높이기 위해 무조건 표본을 많이 뽑기에는 시간과 비용이 너무 많이 든다. 그래서 너무 크지도 너무 작지도 않은 적정한 수준의 표본 수가 필요한데, 이번에는 모평균의 신뢰구간 추정 시 표본크기 결정하는 법을 알아보자.

일단 표본크기를 결정할 때는 허용오차(오차한계)를 알아야 한다. 통계는 다른 수학분야와는 달리 확률로 값을 표현할 뿐, 100% 정답을 다루지는 않는다. 그리고 세상에 어느 정도의 오차는 당연히 존재하기에, 대부분의 통계적 조사가 어느 정도의 오차는 인정하고 진행된다. 하지만 그렇다고 하더라도 오차가 큰 것을 바라지는 않는다. 그래서 어느 정도의 오차는 인정하지만, 일정크기 이상은 인정하지 않는 즉 최대한으로 허용하는 오차가 허용오차(tolerance permissible error). 사실 구간추정인 신뢰구간은 어느 정도의 오차를 인정하고 만든 구간이다. 그리고 허용오차는 기준이 되는 기호가 없이 사람마다 표기하는 기호가 다 다른데, 여기서는 “E”라고 표기하겠다.

 

 

표본크기를 결정할 때는 이 허용오차를 활용하는데, 위의 그림을 보면 허용오차는 신뢰구간의 한쪽 구간과 동일한 것을 알 수 있다. 그래서 표본크기를 결정하는 공식은 다음과 같이 유도할 수 있다.

 

 

그런데 한 가지 짚고 넘어갈 것은, 공식의 σ는 모표준편차가 아니라 대략적인 추정값이다. 왜냐하면 대부분의 통계조사에서 모표준편차(σ)를 알고 있는 경우는 거의 없다. 그리고 표본의 크기를 결정한다는 것은 아직 표본을 뽑기 전이기 때문에, 표본표준편차(s)도 모르는 상황이다. 하지만 표본의 크기를 결정하기 위해서는 표준편차를 알아야 하는데, 그래서 과거에 수집했었던 데이터를 가지고 대략적인 추정값을 구하거나, 아니면 표준편차를 추정하기 위해 따로 조사를 진행해서 추정값을 얻어내곤 한다. 그럼 문제를 하나 풀어보자.

 

 

 

1. 어느 과자 회사에서 생산하는 A과자의 평균용량은 250g이라고 한다. 실제로 그러한지를 알아보기 위해서 조사를 하려고 하는데, 평균에 대해 허용할 수 있는 오차는 10g으로 설정하였다. 그리고 과거의 데이터를 분석해보니 표준편차는 30이라고 한다. 이때 90% 신뢰수준에 적합한 표본크기를 구하시오.

90%의 신뢰수준이기에 Zα/2=1.64이고, σ=30이다. 그리고 허용오차 E=10으로, 계산을 해보면 24.2064가 나온다. 그래서 적정한 표본크기는 25이다.(표본크기는 개수이므로, 소수점은 필요가 없다. 그리고 해당 값 24.2064의 소수점인 0.2064를 처리하려면, 어쨌든 표본이 1개 더 필요하다. 그래서 반올림이 아니라 올림을 한다.)

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. qa

    궁금한 것이 있습니다. 허용오차인 E가 왜 신뢰구간의 한쪽구간 인가요? 신뢰구간 전체가 허용오차 E가 아닌지 의문이드네요

    2014.12.16 20:14 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 그렇게 생각할 수도 있고, 그렇게 생각하셔도 됩니다.

      단지 그렇게 할 경우에는,

      새로운 "용어"가 필요하고,(이미 허용오차는 한쪽 구간만 표현하는 용어입니다.)

      새로운 계산법이 필요합니다.(한쪽만 다룰 때랑, 양쪽 모두 다룰 때는 공식이 달라집니다.)



      그리고 보통 한쪽 구간만 하는 이유는,

      정규분포가 좌우대칭이라서 +, -의 차이만 있을 뿐,

      공식이 서로 같습니다.(왼쪽구간이랑 오른쪽구간 공식이 서로 같습니다.)

      그래서 한쪽 구간만으로도 충분히 계산할 수 있기에,

      굳이 전체구간을 대상으로 하지 않는 것일 수도 있습니다.

      제가 만든 게 아니라서, 저도 추측만 할 뿐입니다 ~_~ㅋ

      2014.12.16 20:35 신고 [ ADDR : EDIT/ DEL ]
  2. jubbal

    문의드립니다.

    아래문제의 허용오차는 시료의 평균 100 g × 0.05
    (틀리게 판단하는 오류 5%) = 5
    그래서 허용오차는 5로 이렇게 계산되어지는 것이 맞는지요?
    --------------------------------------------------------------
    어느 공정에서 제품 한 개당 평균무게는 종전에 105g 이상이었으며, 표준편차는 5g이었다고 한다. 공정의 일부를 변경시킨 다음에 n개의 시료를 뽑아 무게를 측정하였더니 x바 = 100g 이었다. 이 공정의 산포가 종전과 다름이 없다는 조건하에서 다음 물음에 답하시오
    (1)공정 평균이 종전과 다름이 없는데 이를 틀리게 판단하는 오류를 5%, 공정평균이 105g이하인 것을 옳게 판단할 수 있는 검출력을 95%로 하여 검정하려고 하였다면, 위의 검정에서 추출하여야 하는 시료수를 구하시오.
    --------------------------------------------------------------

    2015.01.15 06:33 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • "x바 = 100g 이었다. 이 공정의 산포가 종전과 다름이 없다는 조건하에서"

      문제에 나와 있는 위 문장을 해석해 보면,

      표본평균은 100g인데, 종전의 평균 105g과 동일하게 취급하겠다는 뜻입니다.

      그런데 100g과 105g를 동일하게 취급하겠다는 소리는, 5g의 오차는 인정하겠다는 소리입니다.

      그래서 허용오차는 5입니다.(105g-100g=5g)

      2015.01.15 13:46 신고 [ ADDR : EDIT/ DEL ]
  3. 그렇다면 위 문제에서 시료수 n을 구하면
    Z × 표준편차/루트n = 5로 놓고 '옳게 판단할 수 있는 검출력 95%'가 신뢰수준 95%로 보고
    1.645×4÷루트n=5로 놓고 n을 구하면 1.73 즉
    시료수 2개가 맞는지요?
    문제에서 `이를 틀리게 판단하는 오류를 5%`는 왜 언급되었을까요?

    2015.01.26 12:15 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • (1.96×5/5)제곱=3.8416

      그래서 표본 수는 4개입니다.




      "이를 틀리게 판단하는 오류를 5%"

      그리고 이 문장이 있는 이유는, 그냥 출제자 마음입니다.

      제가 봤을 때는, 굳이 안 들어가도 그만인 문장이네요.

      2015.01.26 14:07 신고 [ ADDR : EDIT/ DEL ]
  4. 비밀댓글입니다

    2015.10.01 11:15 [ ADDR : EDIT/ DEL : REPLY ]
    • 티스토리는 처음이라 모르고 비밀글로 남겼더니 확인이 안되네요;; 답글 공개로 부탁드려요!!

      2015.10.01 11:20 신고 [ ADDR : EDIT/ DEL ]
    • 먼저 고장"률"은 평균이 아니라, 비율입니다.

      그래서 이 문제는

      "모평균의 신뢰구간 표본크기 결정"이 아니라,

      "모비율의 신뢰구간 표본크기 결정"일 겁니다.



      그러니 여기를 참고하세요. http://math7.tistory.com/78

      (참고로 1/4은 0.5를 제곱한 겁니다.)

      2015.10.02 17:41 신고 [ ADDR : EDIT/ DEL ]
  5. 윤희상

    제가 초5인데 더 쉽 게 설 명 해두세요...

    2016.08.27 19:19 신고 [ ADDR : EDIT/ DEL : REPLY ]
  6. 윤희상

    오타 죄송 (설명 해주세요....)

    2016.08.27 19:20 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 이건 "초등학교" 과정이 아니라, "대학교" 과정입니다.

      굳이 볼 필요가 없어 보이네요~

      2016.08.28 13:30 신고 [ ADDR : EDIT/ DEL ]
  7. 임기창

    관광객 100명 평균소비액은 1700달러 표본의 표준편타 200달러. 관광객이 한번방문할때 우리나라에서 쓰는 외화의 평균소비액에 대한 90% 신뢰구간을 작성하라. (90%신뢰수준에대한 z 값은 z0.05 = 1.645)
    이거한번만풀어주실수있나요...?

    2016.12.20 01:21 신고 [ ADDR : EDIT/ DEL : REPLY ]
  8. 임영천

    글 잘 읽었습니다. 모르는게 많이 해결되어 감사드립니다.
    다만 중간에 모표준편차가 아니라 추정값이라고 하셨는데 표본표준편차를 아는 경우 그대로 s로 바꿔 사용하면 되는건가요?

    2017.10.07 23:52 신고 [ ADDR : EDIT/ DEL : REPLY ]