통계2014.11.19 15:55

모비율의 신뢰구간 표본크기 결정하는 법에 대해서 알아보자. 모비율의 신뢰구간 추정 시 표본크기 결정하는 방법은, 모평균의 표본크기 결정하는 법이랑 기본적인 맥락은 비슷하다. 그래서 모평균의 신뢰구간 표본크기 결정(참고)하면 좋을 것 같다. 일단 무엇인가를 조사할 때는, 너무 크지도 너무 작지도 않은 적정한 수준의 표본 수가 필요하다고 했는데, 그럼 모비율의 신뢰구간 추정 시 적정표본크기 결정하는 법을 알아보자.

통계는 100%의 정답을 다루기보다는, 확률로 값을 표현한다. 즉 어느 정도의 오차는 인정하는 것인데, 그러나 어느 정도의 오차는 인정해도 일정크기 이상의 오차는 인정하지 않는 즉 최대한으로 허용하는 오차가 허용오차라고 했다. 그리고 표본의 크기를 결정할 때는 이 허용오차(E)를 사용한다. 사실 신뢰구간은 점추정치를 중심으로 이 허용오차만큼의 구간이라고도 말할 수 있다.

 

 

아무튼 표본크기를 결정할 때는 이 허용오차를 활용하는데, 위의 그림을 보면 허용오차는 신뢰구간의 한쪽 구간과 동일하다. 그래서 모비율의 표본크기를 결정하는 공식을 아래와 같이 유도할 수 있다. 그런데 표본의 크기를 결정한다는 것은 아직 표본을 뽑기 전이기 때문에, 표본비율 은 아직 모르는 상태다. 그래서 이 표본비율에는 가장 작지도 가장 크지도 않은 수치, 딱 중간 수치인 0.5를 대입한다.(확률 0~1사이에서, 중간값은 0.5이다.)

 

그런데 표본크기를 결정하는 것이기 때문에, n을 중심으로 공식을 재배열해야 한다. 재배열해서 얻어낸 공식은 다음과 같은데, 그럼 문제를 하나 풀어보자.

 

 

 

1. 선거를 앞두고 A후보의 지지율을 조사하는데, 이때 표본의 크기를 얼마로 할 것인지 결정하려고 한다. 그리고 이 조사에서 신뢰수준은 99% 그리고 허용오차는 0.02로 설정하였다. 이때 적정표본크기를 구하시오.

99%의 신뢰수준이기에 Zα/2=2.58이고, 허용오차 E=0.02이다. 계산을 해보면 4160.25가 나오는데, 그래서 적정한 표본크기는 4161이다.(표본 크기는 개수이므로, 소수점은 필요가 없다. 그리고 해당 값 4160.25의 소수점인 0.25를 처리하려면, 어쨌든 표본이 1명 더 필요하므로 반올림이 아니라 올림을 한다.)

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. 주인장님 안녕하세요. 너무 잘보고 있어요.ㅎㅎ 감사해요.


    문제를 열심히 보다가 이상한 것을 찾았습니닷...
    문제 1에서 선거 문제요. Z-score는 99%일때 2.575인데, 0.164로 계산 하신 것 같습니닷.

    주인장님 덕분에 통계가 너무 재미있습니다~. ^^

    2014.12.15 02:05 신고 [ ADDR : EDIT/ DEL : REPLY ]
  2. 비밀댓글입니다

    2015.01.28 11:03 [ ADDR : EDIT/ DEL : REPLY ]
  3. 잘못해서 비밀글로 달았더니 볼 수가 없네요..ㅠㅠ
    변동계수0.5인 모집단에서 허용오차율이 5%를 넘지않으면서 모평균에 대한 95.4%의 신뢰수준(z=2)을 유지하도록 하자면 표본을 몇개 이상 추출해야 하는가?

    이 문제는 어떻게 푸나요? 그냥 허용오차값을 0.02라고 보면 되는 것인지.. 아님 변동계수를 이용하는 것인지.. 한 수 부탁드립니다 ㅠㅠ

    2015.01.28 11:39 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 변동계수는 거의 사용하지 않는 개념이라서 저도 확실히는 모르겠지만,

      아마도 변동계수는 "치우침의 정도가 얼마인지"를 파악하는 개념일 겁니다.

      그리고 변동계수의 범위는 0~1까지인 거 같은데,(백분율을 기준으로 하면, 0%~100%)

      변동계수가 0에 가까울수록, 치우침의 정도가 상대적으로 작다는 뜻이고,

      변동계수가 1에 가까울수록, 치우침의 정도가 상대적으로 크다는 뜻입니다.



      그러면 변동계수가 0.5인, 이 모집단의 비율은 상당히 어중간하다는 것을 알 수 있고,

      그래서 가장 어중간한 확률 0.5를 사용합니다.

      그리고 이 확률 0.5를 사용해서 만든 공식이 위의 공식이구요.



      그래서 표본의 수는

      =(z값/(2*허용오차율))의 제곱

      =(2/(2*0.05))의 제곱

      =400개

      2015.01.28 15:20 신고 [ ADDR : EDIT/ DEL ]
    • 아아아아~ 이해됐습니다 ㅎㅎ 오 신기하네요 ㅎㅎ 정말 감사합니다 ㅎ 궁금증 해결됐습니다 ㅎ 정말정말 감사합니다^ ^

      2015.01.28 16:12 신고 [ ADDR : EDIT/ DEL ]
    • 넵 ~_~ㅋ

      2015.01.28 17:00 신고 [ ADDR : EDIT/ DEL ]
  4. 제이션

    제가 푼 문제 해설에서
    표본수 = (z값/(2*허용오차율))의 제곱이 아니라
    표본수 = (2*z값/(2*허용오차율))의 제곱 이라 나옵니다
    허용 오차율이 아니라, 허용 오차율의 범위가 0.05보다 작다 라고 적혀있는데, 이 경우 앞, 뒤로 구해줘야해서 2를 곱해준건가요?

    2016.12.08 14:08 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 직접 보지 않고는 잘 모르겠네요.

      그냥 오타 같기도 한데, 한 번 다른 책들을 확인해보세요~

      2016.12.11 15:44 신고 [ ADDR : EDIT/ DEL ]
  5. 도나이야넹

    갓부랭이님 찬양합니다....

    2016.12.14 01:31 신고 [ ADDR : EDIT/ DEL : REPLY ]
  6. 딸기

    공부하는데 정말 많은 도움 받고 있어요 :) 항상 검색할때 구글에서 알고싶은 수학용어+나부랭이 붙여서 검색한답니다......ㅎㅎㅎ 글 읽고 광고도 한번씩 클릭하고 갑니당 :)

    2017.03.27 16:40 신고 [ ADDR : EDIT/ DEL : REPLY ]