통계2014.12.25 16:28

두 모비율의 가설검정 개념정리를 해보자. 두 모비율의 가설검정 역시 집단 각각의 모수를 파악하는 것이 아니라, 두 집단의 모수가 서로 어떠한 관계인지를 파악하는 것이다. 두 집단의 관계는 같다” “크다” “작다이렇게 3가지로 표현하는데, 보통 뺄셈을 사용해서 관계를 파악한다.(참고) 그래서 귀무가설과 대립가설을 다음과 같이 뺄셈으로 설정할 수가 있고, 그렇기에 가설을 표현하는 방법이 2가지이다.

 

 

그런데 단일 모비율과 마찬가지로, 두 모비율의 가설검정에서도 검정통계량을 조심해야 한다. 보통 두 모평균과 두 모분산의 검정통계량은 신뢰구간에서 사용한 공식을 그대로 사용한다. 하지만 두 모비율의 검정통계량 공식은 신뢰구간과 다르므로, 이점을 조심해야 한다.

 

 

일단 검정통계량을 보면 p1-p2가 있는데, 이것은 가설 속의 모비율이다. 두 모비율의 가설검정은, 모비율인 p1p2를 모르기에 두 모비율의 관계가 이럴 것이다.라는 두 개의 가설 중, 어느 가설이 더 타당한지를 판단하는 것이다. , 모비율 p1p2를 모르는 상태이다. 그래서 검정통계량의 p1p2는 실제의 모비율이 아니라, 가설 속의 모비율이다. 그리고 p1-p2는 대부분 0인 경우가 많다.(응용하면, 0 이외에 다른 수치도 사용할 수 있다.)

 

 

그런데 이 가설 속의 모비율 때문에, 단일 모비율과 두 모비율의 표준편차 구하는 법이 다르다. 먼저 단일 모비율의 경우에는 가설 속의 모비율이 구체적인 수치를 다루므로, 그냥 p를 사용해서 표준편차를 구한다. 하지만 두 모비율의 경우에는 가설 속의 모비율이 구체적인 수치를 다루지 않으므로, p로는 표준편차를 구할 수가 없다. 그래서 표본비율 을 사용한 근삿값으로 표준편차를 구한다.

 

 

그런데 집단이 2개이기에, 각각의 표본비율 를 사용해야 한다. 하지만 공식에서는 그냥 만 다루고 있어서 좀 의아해 할 수도 있는데, 은 그냥 표본비율이 아닌 바로 합동표본비율이다. 합동표본비율은 두 집단의 표본을 합쳐서 계산한 표본비율인데, 계산하는 방법은 다음과 같다.

 

 

이렇게 합동표본비율을 사용하는 이유는, 바로 귀무가설 때문이다. 귀무가설을 보면 p1=p2라고 되어 있는데, 서로 모비율이 같다는 가정이 있기에, 편의상 각각의 표본을 합쳐서 표본비율을 계산하는 것이다. 하지만 이건 좀 억지춘향일 수도 있다. 귀무가설은 원래 =를 사용해서 표현할 뿐, 실제로 서로 같은지는 아직 판단도 나지 않은 상황이다. 그리고 대립가설이 엄연히 를 표현하고 있듯이, 모비율이 서로 다를 확률도 항상 존재한다. 그리고 서로 별개인 두 집단의 모비율이 정확하게 같을 확률은 거의 없다. 그리고 예전에 두 모평균의 σ를 모르는 경우에서 합동표준편차를 사용했을 때랑은 상황도 다르다. 이때는 표본의 수가 적기에, 표본의 수를 늘리려고 합동표준편차를 사용한 거지만, 두 모비율의 경우에는 표본의 수도 크기 때문에 합동표본비율을 사용할 필요성이 없다.

 

 

그래서 개인적인 생각으로는 굳이 이 합동표본비율은 사용하지 않고, 신뢰구간 때 사용한 공식을 그대로 사용해도 된다고 생각하지만, 그럼에도 일반적으로 통용되는 공식이기에 이 합동표본비율을 사용하려고 한다.(표본비율을 각각 구했을 때랑, 합동표본비율로 구했을 때랑, 값은 크게 차이가 나지 않는다.) 그리고 기각역 구하는 법은 단일 모비율과 같으므로, 다룰 내용이 없다. 그냥 다음 포스팅에서 문제를 풀어보면서 다루기로 하자.

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. jubbal

    많이 바쁘시겠지만 질문드립니다.

    문제에 등분산 검정하시오 라고 되어 있으면

    기본적으로 Ho : σ1 =(같다) σ2, H1 : σ1 = /(같지 않다) σ2 로

    놓고 풀면 되는건지요?

    2015.01.22 10:01 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 등분산이 "두 모분산의 관계"를 물어보는 것이라면, 그렇게 하시면 됩니다.

      그리고 그것에 관한 내용은, 아래를 참고하시면 됩니다.

      http://math7.tistory.com/99

      2015.01.22 15:17 신고 [ ADDR : EDIT/ DEL ]
  2. 합동 표준편차를 쓰는 이유가 표본수가 적어 표본의 수를 늘리려고 쓴다고 하셨는데요

    왜 합동 표준편차를 쓰며누표본의수가 늘어나나요??

    2015.10.03 00:06 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 비밀댓글입니다

    2016.11.23 02:58 [ ADDR : EDIT/ DEL : REPLY ]