통계2014.12.17 19:36

두 모분산의 가설검정 문제풀이를 해보자. 일단 두 모분산의 가설검정에서는 F분포를 사용하는데, 검정통계량과 기각역 구하는 데 사용한다. 그리고 기각역은 아래와 같은데, 왼쪽 기각역을 구할 때는 1에 나눠줘야 하고, 자유도가 서로 바뀐다는 점을 조심해야 한다. 그리고 양측검정에서는 α/2를 사용한다. 그럼 몇 가지 문제를 풀어보자.

 

 

 

1. 동일한 제품을 생산하는 기계1과 기계2가 있고, 이 두 기계에서 생산한 제품의 분산은 같은 것으로 알려져 있다. 하지만 최근에는 기계1에서 생산한 제품의 불량이 많아져서, 일부에서는 기계1에서 생산한 제품의 분산이 더 큰 것 같다는 의견이 나오고 있다. 이에 실상을 파악하기 위해 각각 표본 6개와 12개를 뽑아 조사하였더니, 표본분산은 각각 308이 나왔다고 한다. 이때 기계1에서 생산한 제품의 분산이 더 크다고 할 수 있는지 유의수준 10%에서 검정하시오.

대립가설로 기계1에서 생산한 제품의 분산이 더 큰 것 같다는 의견이 나오므로, 대립가설은 σ12이 더 크다로 설정한다. 그리고 검정통계량을 구해보면 3.75가 나온다.

                                                

그럼 기각역을 구해보자. 일단 분자의 자유도 n1-16-1=5이고, 분모의 자유도 n2-112-1=11이다. 그리고 유의수준 α=0.1, 해당 F값을 F분포표()에서 찾으면 2.45가 나온다. 그래서 기각역은 2.45이다.

               

결론을 내면, 검정통계량이 기각역 안에 있으므로 귀무가설이 기각(탈락)된다. 그러므로 기계1에서 생산한 제품의 분산이 더 크다고 할 수 있다.

 

 

 

2. 동일한 것을 분석하는 실험1과 실험2가 있고, 두 실험의 분산은 동일한 것으로 알려져 있다. 그런데 최근에는 실험1의 결과가 더 정확하게 나와서, 실험1의 분산이 더 작은 것 같다는 의견이 나오고 있다. 이에 실제로 그러한지를 파악하기 위해 각각 16번과 7번의 실험을 하였더니, 표본분산은 각각 2125가 나왔다고 한다. 이때 실험1의 분산이 더 작다고 할 수 있는지 유의수준 5%에서 검정하시오.

대립가설로 실험1의 분산이 더 작다는 의견이 나오므로, 대립가설은 σ12이 더 작다로 설정한다. 그리고 검정통계량을 구해보면 0.84가 나온다.

                                                

그럼 기각역을 구해보자. 일단 분자의 자유도 n1-116-1=15이고, 분모의 자유도 n2-17-1=6이다. 그런데 왼쪽 좌표를 구해야 하므로 자유도가 서로 바뀐다. 그래서 왼쪽 기각역의 자유도는 (6, 15)이다. 그리고 유의수준 α=0.05, 해당 값을 표에서 찾으면 2.79가 나온다. 그런데 1에다가 나눠줘야 하므로 1/2.79=0.36이 된다. 그래서 기각역은 0.36이다.

               

결론을 내면, 검정통계량이 채택역 안에 있으므로 귀무가설이 채택된다. 그러므로 실험1의 분산이 더 작다고 할 수 없다.

 

두 모집단을 검정할 때는, 위 문제처럼 좌측검정은 별로 필요 없다. 왜냐하면 집단의 순서만 바꾸면 우측검정이 되기 때문이다.(여기를 참고하면 되는데, 맨 밑에 있다.) 그리고 F분포는 그 특성상 왼쪽좌표 구하는 법이 짜증난다. 그래서 좌측검정보다는 우측검정 하는 것이 정신건강에 좋다. 하지만 위의 문제처럼 나올 경우에는 좌측검정을 해야 한다.

 

 

 

3. 집단1과 집단2의 분산은 동일한 것으로 알려져 있다. 하지만 최근에는 두 집단의 분산이 서로 다른 것 같다는 의견이 나왔다. 그래서 실제로 어떠한지를 알아보기 위해 각각 표본 4개와 6개를 뽑아 조사하였더니, 표본분산은 각각 1510이 나왔다고 한다. 이때 두 집단의 분산이 서로 다르다고 할 수 있는지 유의수준 1%에서 검정하시오.

대립가설로 두 집단의 분산이 서로 다른 것 같다는 의견이 나왔는데, 어느 한 집단의 분산이 더 작은지 큰지는 거론되지 않았다. 그래서 대립가설은 같지 않다로 설정한다. 그리고 검정통계량을 구해보면 1.5가 나온다.

                                                

그럼 기각역을 구해보자. 일단 양측검정이므로 유의수준 α가 둘로 나뉘고, 그래서 α/2=0.005의 확률표를 사용해야 한다. 그리고 왼쪽 기각역의 자유도는 (5, 3)이고, 오른쪽 기각역의 자유도는 (3, 5)이다. 해당 값을 표에서 찾으면 각각 45.3916.53이 나오는데, 왼쪽 좌표는 1에다가 나눠줘야 하므로 1/45.39=0.02가 된다. 그래서 기각역은 0.0216.53이다. 

 

결론을 내보면, 검정통계량이 채택역 안에 위치하므로 귀무가설이 채택된다. 그러므로 두 집단의 분산은 서로 같다고 할 수 있다.

 

양측검정도 좌측검정과 마찬가지로 왼쪽 기각역을 구해야 하므로, 계산하기가 짜증난다. 그래서 이런 경우에는 표본통계량을 바탕으로 가설을 재정립하는 것도 한 방법이다. 그러니까 처음에는 어느 집단이 더 큰지 작은지는 모르지만, 표본을 뽑아보면 어느 집단이 더 큰지를 알 수가 있다. 그래서 위의 문제도 집단1의 표본분산이 15로 더 크기 때문에 가설을 재정립하여, 대립가설을 σ12>σ22으로 세운 후 우측검정을 할 수도 있다. 그리고 이렇게 단측검정을 하는 것이, 양측검정을 하는 것보다 검정력이 더 좋다.(양측검정은 기각역이 양쪽으로 나뉘기 때문에, 단측검정에 비해서 검정력이 떨어진다.) 하지만 위의 문제처럼 나올 경우에는 양측검정을 해야 한다.

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. 오늘 혹시 두 모비율의 가설 검정에 대한 내용을 올려주실런지 기대하면서 계속 들어오고 있습니다ㅋㅋㅋㅋ 항상 잘 보고 있습니더 감사합니다~

    2014.12.18 18:10 신고 [ ADDR : EDIT/ DEL : REPLY ]
  2. 화학도;;

    만약에 두 모분산이 같은 경우와 같지 않은 경우를 산정하고 풀어야 하는 문제인데, 각각의 분포의 자유도가 같으면 어떻게 되는거죠? 그러면 오른쪽값이랑 왼쪽 값이 같자나요....;;?

    2015.01.13 20:56 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 화학도;;

    아하 왼쪽은 나눠주게 되니까 달라지는군요

    2015.01.13 20:57 신고 [ ADDR : EDIT/ DEL : REPLY ]
  4. jubbal

    문제 질문 드립니다.

    1)번 문제의 '중심 및 산포'는 중심은 모평균이고 산포는 모분산으로 당연히 생각해야 겠지요?
    그리고 크다, 작다라는 말이 없이 '중심 및 산포에 대하여 유의차 검정하시오'라는 이야기는
    대립가설로 "같지 않다" 라고 설정하는 것인지 질문을 드립니다.
    ----------------------------------------------------------------
    다음 표는 공정조건을 개선하여 얻은 개선 전,후 인장강도(망대특성)자료이다.
    인장강도 특성은 정규분포를 따른다고 알려져 있다.
    다음 물음에 답하시오
    개선 전 : 80.0 81.2 79.5 78.0 76.1 77.0 80.1 79.9 78.8 80.8
    개선 후 : 80.4 78.2 80.1 77.1 79.6 80.4 81.6 79.9 84.4 80.9 83.1

    (단, t0.95(19)=1.729, t0.975(19)=2.093, t0.95(20)=1.725, t0.975(20)=2.086
    F0.95(9,10)=3.02, F0.975(9,10)=3.78, F0.95(10,9)=3.14, F0.975(10,9)=3.96이다)

    1)개선 전,후의 중심 및 산포에 대하여 유의수준 0.05로 유의차 검정하시오
    2)개선 전,후에 따른 모평균 차이에 대하여 95% 신뢰구간을 구하시오.
    --------------------------------------------------------------

    2015.01.15 21:26 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 대립가설은 "같지 않다"가 맞는 것 같네요.



      그리고 "중심"이랑 "산포"는 잘 사용하는 단어가 아니라서,

      교제를 직접 보지 않는 한 확답은 못 드리겠네요~

      그리고 문제의 문장이 좀 정신없네요.



      만약에 중심은 평균을, 산포는 분산을 나타내는 것이라면,

      이 문제는 "모평균의 가설검정"과 "모분산의 가설검정"

      이렇게 2번의 가설검정을 해야 될 것 같은데요.("중심 및 산포"는 둘 다 물어보는 것이기에)



      추가로 개선 전후의 차이만 있을 뿐, 기본적으로 한 집단이기에,

      "쌍체비교의 가설검정"으로도 구할 수 있습니다.(그런데 쌍체비교는 분산은 검정을 못 합니다.)

      그런데 개선 전후의 표본 수가 달라서 쌍체비교는 안 될 것 같네요.

      2015.01.15 16:07 신고 [ ADDR : EDIT/ DEL ]
  5. jubbal

    문제는 품질관리기술사 104회에 기출된 문제입니다.
    문제 전체문장을 적지 않아 수정하여 문제의 모든 문장을 적었습니다.

    중심을 나타내는 것은 평균, 중간값 등
    산포를 나타내는 것은 표준편차, 분산, 범위 등 으로 배운것 같은데

    문제에 명확히 제시한 기준이 없으니
    조건에 t분포, F분포를 보여주는 것을 봐서라도 중심=평균, 산포는=분산으로 계산해도 이의를 제기하기 어렵겠지요?

    2015.01.15 22:31 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 네.. 그렇게 푸시는 게 맞는 거 같은데요.


      그래서

      중심은 "두 모평균의 가설검정(σ를 모르는 경우)"으로 풀고,

      산포는 "두 모분산의 가설검정"으로 풀면 될 것 같은데요.


      근데 저도 이런 문제는 처음 봐서요;;

      제 말을 너무 믿지는 마세요 ~_~

      2015.01.16 13:38 신고 [ ADDR : EDIT/ DEL ]
  6. ddd

    안녕하세요 얼마전 F분포 좌측 기각역 계산식에 대해 질문 했던 사람입니다. 다름이 아니고, 식 유도나 증명은 잘 모르시겠다고 답변을 주셔서 그렇다면 혹시 포스팅 내용에 올리신 임계치 계산식의 출처나 참고할만한 자료를 아실까 해서 질문 남깁니다.

    2015.04.16 15:43 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 글쎄요..

      제가 참고했었던 모든 통계 책이,

      이 부분을 대충 다루고 있어서요.

      딱히 추천해 드릴 만한 자료가 없네요;;

      2015.04.16 20:31 신고 [ ADDR : EDIT/ DEL ]
  7. 궁금

    f 검정에서 단측, 양측 검정을 잘 알수 있었던 것 같습니다. 그런데 관련한 sas 코드를 알고 계신가요? sas에서는 단측검정에 대한 옵션이 없네요.ㅠㅠ

    2016.01.07 09:25 신고 [ ADDR : EDIT/ DEL : REPLY ]