통계2014.11.17 16:02

모비율의 신뢰구간 구하는법을 알아보자. 신뢰구간이나 가설검정에서는 보통 평균분산 그리고 비율 이렇게 3가지 척도를 많이 다루는데, 이번에는 비율에 대해서 알아보자. 일단 구하고자 하는 수가, 전체에서 차지하는 비중이 비율인데, 표본일 때랑 모집단일 때에 따라 표기하는 기호가 서로 다르다. 그래서 보통 표본비율을 (피햇)이라고 표기하고, 모비율을 그냥 p라고 표기한다. 그림으로 표현하면 다음과 같다.

보통 모비율은 아는 경우가 거의 없기에, 비율에서는 표본비율을 구하는 경우가 대부분인데, 표본비율 구하는 법은 의외로 간단하다. 예를 들어 사람 100명이 있는데, 이 중 여성은 40명이라고 한다. 이때 여성의 비율은 0.4 혹은 40%인 것을 쉽게 알 수 있다. 이렇게 표본비율은 구하고자 하는 수를, 전체의 수로 나눠주면 된다. 그럼 신뢰구간 구하는 법을 알아보자.

 

 

신뢰구간을 추정할 때는 확률분포를 사용한다고 했는데, 비율의 신뢰구간은 정규분포를 사용한다. 그리고 모비율의 신뢰구간 길이는 정규분포 그래프의 x축 좌표를 활용하는데, 모수가 신뢰구간 안에 포함되지 않을 확률 α에 해당하는 x축 좌표를 사용한다. 그런데 α가 양쪽으로 나뉘기 때문에 α/2가 되고, α/2에 해당하는 정규분포 그래프의 x축 좌표는 다음과 같다.

 

 

그리고 신뢰구간을 추정할 때는 α/2에 해당하는 x축 좌표와 함께 통계량을 알아야 하는데, 정규분포를 사용하기에 Z통계량(정규분포 표준화 공식)을 사용한다. 대신 비율을 구하는 것이기 때문에, 표본평균 엑스바 대신 표본비율 피햇이 들어가고, 모평균 μ 대신 모비율 p가 들어간다. 그리고 모표준편차 σ 대신 표본표준편차 이 들어가는데,(모표준편차를 모르기 때문에 표본표준편차를 사용한다.) 은 비율을 사용해서 구하는 표준편차다.

 

 

Z통계량과 α/2에 해당하는 x축 좌표를 활용하면 신뢰구간 공식을 유도할 수가 있는데, 모비율 p를 추정하는 것이기 때문에, p를 중심으로 공식을 재배열하면 된다. 공식을 재배열해서 얻어낸 모비율의 신뢰구간 공식은 다음과 같은데, 그럼 다음 포스팅에서는 문제풀이를 해보자.

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. 비밀댓글입니다

    2014.12.08 19:45 [ ADDR : EDIT/ DEL : REPLY ]
  2. 1234

    모비율은 t분포를 쓰지 않는것인가요?

    2015.12.05 16:27 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • t분포는 대체로 표본의 수가 적을 때 사용합니다.

      그런데 모비율은 대체로 표본의 수가 많아서,

      t분포를 사용하지 못하는 경우가 많습니다.

      2015.12.07 14:43 신고 [ ADDR : EDIT/ DEL ]