통계2014.12.27 17:56

두 모비율의 가설검정 문제풀이를 해보자. 두 모비율의 가설검정은 단일 모비율과 마찬가지로 검정통계량 공식이 신뢰구간과 다르므로, 이 점을 조심해야 한다. 그리고 기본적으로 정규분포를 사용하기에 자주 사용하는 Z값이 몇 개로 한정되어 있는데, 그래서 매번 표준정규분포표에서 Z값을 찾는 번거로움이 없다. 해당 Z값은 아래와 같다.

 

 

 

1. 동일한 제품을 생산하는 2대의 기계가 있는데, 두 기계에서 생산하는 제품의 불량률은 서로 같은 것으로 알려져 있다. 하지만 최근 품질관리팀의 조사에 의하면, 불량률이 서로 다를 수도 있다는 의견이 나오고 있다. 이에 실제로 어떠한지를 알아보기 위해 각각 표본 120개와 130개를 뽑았더니, 불량품은 각각 6개와 4개가 나왔다고 한다. 이때 두 기계에서 생산하는 제품의 불량률은 서로 다르다고 할 수 있는지, 유의수준 10%에서 검정하시오.

대립가설로 불량률이 서로 다를 수도 있다는 의견이 나왔는데, 어느 특정 기계의 불량률이 더 작은지 큰지는 거론되지 않았다. 그래서 대립가설은 같지 않다로 설정한다. 그리고 기계1의 표본비율은 6/120=0.05이고, 기계2의 표본비율은 4/130=0.03이다. 마지막으로 합동표본비율 구해보면 (6+4)/(120+130)=0.04가 나온다.

                                          

그래서 검정통계량을 구해보면 0.806이 나오는데, 기각역을 구해서 서로 비교해보자. 일단 유의수준 α=0.1인데, 양측검정이므로 α/2=0.05에 해당하는 Z1.645를 사용해야 한다. 그런데 양쪽으로 설정해야 하므로, 기각역은 ±1.645가 된다.

                

결론을 내보면, 검정통계량이 채택역 안에 위치하므로 귀무가설이 채택된다. 그러므로 두 기계에서 생산하는 제품의 불량률은 서로 같다고 할 수 있다.

 

 

 

2. 도시와 시골의 흡연율이 차이가 나는지를 조사하는데, 조사팀의 분석에 의하면 도시의 흡연율이 더 높을 수도 있다고 한다. 이에 실제로 어떠한지를 알아보기 위해 각각 200명과 150명을 뽑아 흡연율을 조사하였더니, 흡연자는 총 80명과 50명이 나왔다고 한다. 이때 도시의 흡연율이 더 높다고 할 수 있는지, 유의수준 1%에서 검정하시오.

대립가설로 도시의 흡연율이 더 높을 수도 있다는 소리가 나오므로, 대립가설은 p1이 더 크다로 설정한다. 그리고 도시 지역의 표본비율은 80/200=0.4이고, 시골 지역의 표본비율은 50/150=0.33이다. 마지막으로 합동표본비율 구해보면 (80+50)/(200+150)=0.37이 나온다.

                                          

그래서 검정통계량을 구해보면 1.342가 나오는데, 기각역과 비교해보자. 일단 유의수준 α=0.01인데, 0.01에 해당하는 Z값은 2.326이다. 그래서 기각역은 2.326이다.

                

결론을 내보면, 검정통계량이 채택역 안에 있으므로 귀무가설이 채택된다. 그러므로 도시의 흡연율이 더 높다고 할 수 없다.

 

 

 

3. 현 정부에 대한 두 지역 AB의 지지율이 차이가 나는지를 조사한다고 한다. 그런데 조사팀의 분석에 의하면 지역 A의 지지율이 더 낮을 수도 있다고 한다. 이에 실제로 어떠한지를 알아보기 위해 각각 400명과 350명을 뽑아 조사하였더니, 현 정부를 지지하는 사람은 각각 40명과 90명이 나왔다고 한다. 이때 지역 A의 지지율이 더 낮다고 할 수 있는지, 유의수준 5%에서 검정하시오.

대립가설로 지역 A의 지지율이 더 낮을 수도 있다는 소리가 나오므로, 대립가설은 p1이 더 작다로 설정한다. 그리고 지역 A의 표본비율은 40/400=0.1이고, 지역 B의 표본비율은 90/350=0.26이다. 마지막으로 합동표본비율 구해보면 (40+90)/(400+350)=0.17이 나온다.

                                         

그래서 검정통계량을 구해보면 -5.82가 나오는데, 기각역과 비교해보자. 일단 유의수준 α=0.05인데, 0.05에 해당하는 Z값은 1.645이다. 그런데 왼쪽 좌표이기에 를 붙여야 하므로 기각역은 1.645가 된다.

                

결론을 내보면, 검정통계량이 기각역 안에 있으므로 귀무가설이 기각(탈락)된다. 그러므로 현 정부에 대한 지역 A의 지지율이 더 낮다고 할 수 있다.(두 모집단의 가설검정에서는, 이 문제처럼 좌측검정은 별로 필요가 없다. 왜냐하면 집단의 순서만 바꾸면 우측검정이 되기 때문이다. 자세한 상황은 여기 글을 참고하면 되는데, 맨 밑에 있다.)

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. 나부랭이팬

    포스팅 잘보고있습니다! 공부하는데 많이 도움이되네요ㅠㅠ
    제가 회귀분석에 대해 궁금한것이 있는데 혹시 물어봐도되는지요?ㅠ
    외국에서 공부하고있어서 언어때문에 공부하기가 더 힘이 드네요ㅠㅠㅠ

    2014.12.27 18:24 신고 [ ADDR : EDIT/ DEL : REPLY ]
  2. 나부랭이팬

    그러시구나ㅠㅠ 그럼 어느부분까지 포스팅하실 생각이신가요??
    포스팅하신 내용들이 공부하는데 도움이 많이되요!^^

    2014.12.28 21:02 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 글쎄요.. 회귀분석도 다루기는 할 거 같은데,

      막상 그때가 되어봐야 알 것 같네요 ~_~

      2014.12.29 13:58 신고 [ ADDR : EDIT/ DEL ]
  3. 나부랭이팬

    넹넹! ^^
    포스팅항상 감사해요~ 수고하세요!

    2014.12.29 21:25 신고 [ ADDR : EDIT/ DEL : REPLY ]
  4. 죄송합니다만

    저기 식에서 밑에 루트 따로따로 해야되는거죠?

    2016.06.12 20:02 신고 [ ADDR : EDIT/ DEL : REPLY ]