통계2014.12.17 19:36

두 모분산의 가설검정 문제풀이를 해보자. 일단 두 모분산의 가설검정에서는 F분포를 사용하는데, 검정통계량과 기각역 구하는 데 사용한다. 그리고 기각역은 아래와 같은데, 왼쪽 기각역을 구할 때는 1에 나눠줘야 하고, 자유도가 서로 바뀐다는 점을 조심해야 한다. 그리고 양측검정에서는 α/2를 사용한다. 그럼 몇 가지 문제를 풀어보자.

 

 

 

1. 동일한 제품을 생산하는 기계1과 기계2가 있고, 이 두 기계에서 생산한 제품의 분산은 같은 것으로 알려져 있다. 하지만 최근에는 기계1에서 생산한 제품의 불량이 많아져서, 일부에서는 기계1에서 생산한 제품의 분산이 더 큰 것 같다는 의견이 나오고 있다. 이에 실상을 파악하기 위해 각각 표본 6개와 12개를 뽑아 조사하였더니, 표본분산은 각각 308이 나왔다고 한다. 이때 기계1에서 생산한 제품의 분산이 더 크다고 할 수 있는지 유의수준 10%에서 검정하시오.

대립가설로 기계1에서 생산한 제품의 분산이 더 큰 것 같다는 의견이 나오므로, 대립가설은 σ12이 더 크다로 설정한다. 그리고 검정통계량을 구해보면 3.75가 나온다.

                                                

그럼 기각역을 구해보자. 일단 분자의 자유도 n1-16-1=5이고, 분모의 자유도 n2-112-1=11이다. 그리고 유의수준 α=0.1, 해당 F값을 F분포표()에서 찾으면 2.45가 나온다. 그래서 기각역은 2.45이다.

               

결론을 내면, 검정통계량이 기각역 안에 있으므로 귀무가설이 기각(탈락)된다. 그러므로 기계1에서 생산한 제품의 분산이 더 크다고 할 수 있다.

 

 

 

2. 동일한 것을 분석하는 실험1과 실험2가 있고, 두 실험의 분산은 동일한 것으로 알려져 있다. 그런데 최근에는 실험1의 결과가 더 정확하게 나와서, 실험1의 분산이 더 작은 것 같다는 의견이 나오고 있다. 이에 실제로 그러한지를 파악하기 위해 각각 16번과 7번의 실험을 하였더니, 표본분산은 각각 2125가 나왔다고 한다. 이때 실험1의 분산이 더 작다고 할 수 있는지 유의수준 5%에서 검정하시오.

대립가설로 실험1의 분산이 더 작다는 의견이 나오므로, 대립가설은 σ12이 더 작다로 설정한다. 그리고 검정통계량을 구해보면 0.84가 나온다.

                                                

그럼 기각역을 구해보자. 일단 분자의 자유도 n1-116-1=15이고, 분모의 자유도 n2-17-1=6이다. 그런데 왼쪽 좌표를 구해야 하므로 자유도가 서로 바뀐다. 그래서 왼쪽 기각역의 자유도는 (6, 15)이다. 그리고 유의수준 α=0.05, 해당 값을 표에서 찾으면 2.79가 나온다. 그런데 1에다가 나눠줘야 하므로 1/2.79=0.36이 된다. 그래서 기각역은 0.36이다.

               

결론을 내면, 검정통계량이 채택역 안에 있으므로 귀무가설이 채택된다. 그러므로 실험1의 분산이 더 작다고 할 수 없다.

 

두 모집단을 검정할 때는, 위 문제처럼 좌측검정은 별로 필요 없다. 왜냐하면 집단의 순서만 바꾸면 우측검정이 되기 때문이다.(여기를 참고하면 되는데, 맨 밑에 있다.) 그리고 F분포는 그 특성상 왼쪽좌표 구하는 법이 짜증난다. 그래서 좌측검정보다는 우측검정 하는 것이 정신건강에 좋다. 하지만 위의 문제처럼 나올 경우에는 좌측검정을 해야 한다.

 

 

 

3. 집단1과 집단2의 분산은 동일한 것으로 알려져 있다. 하지만 최근에는 두 집단의 분산이 서로 다른 것 같다는 의견이 나왔다. 그래서 실제로 어떠한지를 알아보기 위해 각각 표본 4개와 6개를 뽑아 조사하였더니, 표본분산은 각각 1510이 나왔다고 한다. 이때 두 집단의 분산이 서로 다르다고 할 수 있는지 유의수준 1%에서 검정하시오.

대립가설로 두 집단의 분산이 서로 다른 것 같다는 의견이 나왔는데, 어느 한 집단의 분산이 더 작은지 큰지는 거론되지 않았다. 그래서 대립가설은 같지 않다로 설정한다. 그리고 검정통계량을 구해보면 1.5가 나온다.

                                                

그럼 기각역을 구해보자. 일단 양측검정이므로 유의수준 α가 둘로 나뉘고, 그래서 α/2=0.005의 확률표를 사용해야 한다. 그리고 왼쪽 기각역의 자유도는 (5, 3)이고, 오른쪽 기각역의 자유도는 (3, 5)이다. 해당 값을 표에서 찾으면 각각 45.3916.53이 나오는데, 왼쪽 좌표는 1에다가 나눠줘야 하므로 1/45.39=0.02가 된다. 그래서 기각역은 0.0216.53이다. 

 

결론을 내보면, 검정통계량이 채택역 안에 위치하므로 귀무가설이 채택된다. 그러므로 두 집단의 분산은 서로 같다고 할 수 있다.

 

양측검정도 좌측검정과 마찬가지로 왼쪽 기각역을 구해야 하므로, 계산하기가 짜증난다. 그래서 이런 경우에는 표본통계량을 바탕으로 가설을 재정립하는 것도 한 방법이다. 그러니까 처음에는 어느 집단이 더 큰지 작은지는 모르지만, 표본을 뽑아보면 어느 집단이 더 큰지를 알 수가 있다. 그래서 위의 문제도 집단1의 표본분산이 15로 더 크기 때문에 가설을 재정립하여, 대립가설을 σ12>σ22으로 세운 후 우측검정을 할 수도 있다. 그리고 이렇게 단측검정을 하는 것이, 양측검정을 하는 것보다 검정력이 더 좋다.(양측검정은 기각역이 양쪽으로 나뉘기 때문에, 단측검정에 비해서 검정력이 떨어진다.) 하지만 위의 문제처럼 나올 경우에는 양측검정을 해야 한다.

Posted by 나부랭이

댓글을 달아 주세요

  1. 오늘 혹시 두 모비율의 가설 검정에 대한 내용을 올려주실런지 기대하면서 계속 들어오고 있습니다ㅋㅋㅋㅋ 항상 잘 보고 있습니더 감사합니다~

    2014.12.18 18:10 신고 [ ADDR : EDIT/ DEL : REPLY ]
  2. 화학도;;

    만약에 두 모분산이 같은 경우와 같지 않은 경우를 산정하고 풀어야 하는 문제인데, 각각의 분포의 자유도가 같으면 어떻게 되는거죠? 그러면 오른쪽값이랑 왼쪽 값이 같자나요....;;?

    2015.01.13 20:56 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 화학도;;

    아하 왼쪽은 나눠주게 되니까 달라지는군요

    2015.01.13 20:57 신고 [ ADDR : EDIT/ DEL : REPLY ]
  4. jubbal

    문제 질문 드립니다.

    1)번 문제의 '중심 및 산포'는 중심은 모평균이고 산포는 모분산으로 당연히 생각해야 겠지요?
    그리고 크다, 작다라는 말이 없이 '중심 및 산포에 대하여 유의차 검정하시오'라는 이야기는
    대립가설로 "같지 않다" 라고 설정하는 것인지 질문을 드립니다.
    ----------------------------------------------------------------
    다음 표는 공정조건을 개선하여 얻은 개선 전,후 인장강도(망대특성)자료이다.
    인장강도 특성은 정규분포를 따른다고 알려져 있다.
    다음 물음에 답하시오
    개선 전 : 80.0 81.2 79.5 78.0 76.1 77.0 80.1 79.9 78.8 80.8
    개선 후 : 80.4 78.2 80.1 77.1 79.6 80.4 81.6 79.9 84.4 80.9 83.1

    (단, t0.95(19)=1.729, t0.975(19)=2.093, t0.95(20)=1.725, t0.975(20)=2.086
    F0.95(9,10)=3.02, F0.975(9,10)=3.78, F0.95(10,9)=3.14, F0.975(10,9)=3.96이다)

    1)개선 전,후의 중심 및 산포에 대하여 유의수준 0.05로 유의차 검정하시오
    2)개선 전,후에 따른 모평균 차이에 대하여 95% 신뢰구간을 구하시오.
    --------------------------------------------------------------

    2015.01.15 21:26 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 대립가설은 "같지 않다"가 맞는 것 같네요.



      그리고 "중심"이랑 "산포"는 잘 사용하는 단어가 아니라서,

      교제를 직접 보지 않는 한 확답은 못 드리겠네요~

      그리고 문제의 문장이 좀 정신없네요.



      만약에 중심은 평균을, 산포는 분산을 나타내는 것이라면,

      이 문제는 "모평균의 가설검정"과 "모분산의 가설검정"

      이렇게 2번의 가설검정을 해야 될 것 같은데요.("중심 및 산포"는 둘 다 물어보는 것이기에)



      추가로 개선 전후의 차이만 있을 뿐, 기본적으로 한 집단이기에,

      "쌍체비교의 가설검정"으로도 구할 수 있습니다.(그런데 쌍체비교는 분산은 검정을 못 합니다.)

      그런데 개선 전후의 표본 수가 달라서 쌍체비교는 안 될 것 같네요.

      2015.01.15 16:07 신고 [ ADDR : EDIT/ DEL ]
  5. jubbal

    문제는 품질관리기술사 104회에 기출된 문제입니다.
    문제 전체문장을 적지 않아 수정하여 문제의 모든 문장을 적었습니다.

    중심을 나타내는 것은 평균, 중간값 등
    산포를 나타내는 것은 표준편차, 분산, 범위 등 으로 배운것 같은데

    문제에 명확히 제시한 기준이 없으니
    조건에 t분포, F분포를 보여주는 것을 봐서라도 중심=평균, 산포는=분산으로 계산해도 이의를 제기하기 어렵겠지요?

    2015.01.15 22:31 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 네.. 그렇게 푸시는 게 맞는 거 같은데요.


      그래서

      중심은 "두 모평균의 가설검정(σ를 모르는 경우)"으로 풀고,

      산포는 "두 모분산의 가설검정"으로 풀면 될 것 같은데요.


      근데 저도 이런 문제는 처음 봐서요;;

      제 말을 너무 믿지는 마세요 ~_~

      2015.01.16 13:38 신고 [ ADDR : EDIT/ DEL ]
  6. ddd

    안녕하세요 얼마전 F분포 좌측 기각역 계산식에 대해 질문 했던 사람입니다. 다름이 아니고, 식 유도나 증명은 잘 모르시겠다고 답변을 주셔서 그렇다면 혹시 포스팅 내용에 올리신 임계치 계산식의 출처나 참고할만한 자료를 아실까 해서 질문 남깁니다.

    2015.04.16 15:43 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 글쎄요..

      제가 참고했었던 모든 통계 책이,

      이 부분을 대충 다루고 있어서요.

      딱히 추천해 드릴 만한 자료가 없네요;;

      2015.04.16 20:31 신고 [ ADDR : EDIT/ DEL ]
  7. 궁금

    f 검정에서 단측, 양측 검정을 잘 알수 있었던 것 같습니다. 그런데 관련한 sas 코드를 알고 계신가요? sas에서는 단측검정에 대한 옵션이 없네요.ㅠㅠ

    2016.01.07 09:25 신고 [ ADDR : EDIT/ DEL : REPLY ]
  8. 쏘론

    아... 덕분에 완전히 이해하고 갑니다 자세하고 세세한 설명 감사드려요

    2018.04.15 06:02 신고 [ ADDR : EDIT/ DEL : REPLY ]
  9. 나그네

    안녕하세요.

    분산분석시

    귀무가설 Ho : a<=b
    대립가설 H1 : a > b
    이면, 우측검정사용


    귀무가설 Ho : a>=b
    대립가설 H1 : a < b
    이면, 좌측검정사용


    귀무가설 Ho : a=b
    대립가설 H1 : a ≠ b
    이면, 양측검정사용

    그런데,

    귀무가설 Ho : a=b=c=d=0
    대립가설 H1 : 최소한 하나의 a , b , c , d 는 ≠ 0 이다

    에서는 우측검정을 사용하는데요.

    혹시, 이유 좀 알 수 있을까요?

    2018.07.05 20:37 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 분산분석은 기본적으로 가설검정의 틀을 사용하지만,

      분산분석에 맞게 약간 변한 겁니다.

      그래서 가설검정에서 사용하는 ≠와

      분산분석에서 사용하는 ≠는 서로 의미가 다릅니다.



      일단 가설검정에서는 "방향"이 중요합니다.(작은지 아니면 큰지)

      그래서 대립가설을 방향으로 표현합니다.

      μ< 0 ← 0보다 작은지

      μ> 0 ← 0보다 큰지

      μ≠0 ← 큰지 작은지를 모를 때 사용(양측검정)

      여기서 ≠는 큰지 작은지를 모르는 것이기에, 그래서 양측검정을 하는 겁니다.



      반대로 분산분석은 방향은 필요 없고, 대신 "치우침이 있는지"가 중요합니다.

      그래서 가설도 치우침이 "있는지" 아니면 "없는지"만 파악하면 됩니다.

      H0: μ1 = μ2 = μ3 ← (치우침이 없기에) 세 집단의 평균은 같다.

      H1: 적어도 하나는 다르다. ← (치우침이 있기에) 적어도 하나는 다르다.

      이렇게 분산분석은 치우침이 있는지만 파악할 뿐, 방향은 중요하지 않기에, 양측검정을 하지 않습니다.

      그리고 F분포표가 기본적으로 우측검정을 사용하기에, 좌측검정도 하지 않습니다.

      (방향이 중요하지 않기에, 굳이 좌측검정을 할 필요가 없습니다)



      이렇게 검정하고자 하는 것이 서로 다르기에, ≠의 의미가 서로 다릅니다.

      가설검정의 ≠: 방향을 모른다는 표현

      분산분석의 ≠: 치우침이 있다는 표현

      2018.07.06 13:59 신고 [ ADDR : EDIT/ DEL ]
  10. 나그네

    시원한 답변 감사합니다.

    이제 통계가 좀 보이기 시작하네요

    2018.07.07 09:33 신고 [ ADDR : EDIT/ DEL : REPLY ]