통계2014.12.12 18:44

두 모평균의 가설검정 문제풀이(σ를 모르는 경우)를 해보자. 일단 σ를 모르는 경우에는, 표본에서 얻어낸 표본표준편차 s를 사용한다. 그런데 표본의 수가 적으면 s값의 신뢰도가 떨어지기에, 두 집단의 표준편차인 s1, s2를 한 번에 모아서 계산한 합동표준편차 sp를 사용한다. 그리고 검정 시 기본적으로 t분포를 사용하는데, t분포는 표본의 수가 많아지면 사용할 수가 없다. 그래서 대표본일 경우에는 정규분포를 사용한다.

 

 

 

1. 공대생과 인문대생의 월평균 독서량이 차이가 나는지를 알아보려고 한다. 그래서 공대생 10명과 인문대생 11명을 뽑아 월평균 독서량을 조사하였더니, 각각 월평균 0.5권과 3.5권을 읽는다고 한다. 그리고 표본분산은 각각 47이 나왔다고 한다. 이때 공대생과 인문대생의 월평균 독서량이 차이가 나는지를 유의수준 5%에서 검정하시오.

대립가설로 월평균 독서량이 차이가 나는지를 알아보려고 하는데, 어느 집단이 더 적은지 많은지는 거론되지 않았다. 그래서 대립가설을 같지 않다로 설정한다.

 

그리고 합동표준편차 구해보면 2.362가 나오고, 이어서 검정통계량을 구해보면 2.91이 나온다.(문제에서 표본의 데이터가 주어졌을 시에는, 손수 표본분산을 구해야 하는데, 표본분산 구하는 법은 여기를 (참고)하면 된다.)

                                           

그럼 기각역을 구해보자. 일단 유의수준 α=0.05인데, 양측검정이므로 α/2=0.025에 해당하는 값을 t분포표()에서 찾아야 한다.(자유도는 10+11-2=19이다.) 표에서 해당 값을 찾으면 2.093이 나오는데, 양쪽으로 설정해야 하므로 기각역은 ±2.093이라는 것을 알 수 있다.

         

결론을 내보면, 검정통계량이 기각역 안에 위치하므로 귀무가설이 기각(탈락)된다. 그러므로 공대생과 인문대생의 월평균 독서량은 차이가 난다고 할 수 있다.

 

 

 

2. 두 개의 진통제 AB가 있는데, 진통제 B의 약 효과가 7시간 더 길다고 한다. 하지만 일부에서는 7시간보다는 차이가 작다는 의견이 나오고 있다. 실제로 그러한지를 알아보기 위해 각 진통제 11개와 9개를 뽑아 조사하였더니, 진통제 A의 평균 약 효과는 17시간이 나왔고, 진통제 B의 평균 약 효과는 23시간이 나왔다고 한다. 그리고 표본분산은 각각 67이 나왔다고 한다. 이때 두 진통제의 약 효과 차이는 7시간보다 작다고 할 수 있을지, 유의수준 10%에서 검정하시오.

응용된 문제로, 이런 문제는 가설 세우는 것이 생각보다는 복잡하다. 그래서 가설 세우는 법을 자세히 알아보자. 보통 가설을 세울 때는  μ1-μ2=0처럼 “0”으로 세우는 것이 일반적인데, 귀무가설로 μ1μ2가 같다라고 세우기 때문이다. 그래서 0인 것이다. 하지만 위의 문제는 원래부터 μ1μ2가 같은 것이 아니라, 7시간의 차이가 있었다. 그래서 0 대신 7을 넣어야 한다. 그런데 B의 평균이 더 크기 때문에, B에서 7을 빼줘야 A와 값이 같아진다. 그래서 7이 들어간다.

 

그리고 대립가설로 “7시간보다는 차이가 작다는 의견이 나왔는데, 두 집단의 차이가 7시간보다 작으려면, 어쨌든 A의 평균이 알려져 있는 것보다 더 커야 가능하다. 그래서 대립가설의 부등호를 A가 더 크다로 세우면 된다. 마지막으로 μ2를 왼쪽으로 넘기면 가설이 완성된다.

                                          

그리고 합동표준편차 구해보면 2.539가 나오고, 이어서 검정통계량을 구해보면 0.88이 나오는데, 한 가지 주의할 것은 검정통계량의 μ1-μ20 대신 -7을 넣어야 한다.

                                            

기각역을 구해보자. 일단 유의수준 α=0.1이고 자유도는 11+9-2=18이다. 해당 값을 t분포표에서 찾으면 1.33이 나오는데, 그래서 기각역은 1.33이다.

         

결론을 내면, 검정통계량이 채택역 안에 있으므로 귀무가설이 채택된다. 그러므로 진통제 B의 약 효과가 7시간 더 길다고 할 수 있다.

 

 

 

3. 핸드폰 배터리 AB가 있는데, A배터리의 지속시간이 더 짧다는 의견이 나오고 있다. 실제로 그러한지를 알아보기 위해 각 배터리 31개과 12개를 통해 지속시간을 조사해보니, A배터리의 평균 지속시간은 12시간이었고, B배터리의 평균 지속시간은 15시간이었다. 그리고 표본분산은 각각 65가 나왔다고 한다. 이때 A배터리의 지속시간이 더 짧다고 할 수 있을지 유의수준 1%에서 검정하시오.

대립가설로 A배터리의 지속시간이 더 짧다는 의견이 나오므로, 대립가설은 μ1이 더 작다로 설정한다. 그리고 검정통계량을 구해보면 3.84가 나온다.

                                                              

이제 기각역을 구해보자. 먼저 자유도를 구해보면 31+12-2=41이 나오는데, 이 자유도 41 t분포표에 없다. 그래서 정규분포를 사용해야 하는데, 유의수준 α=0.01에 해당하는 Z값을 정규분포표에서 찾으면 2.33이 나온다. 그런데 왼쪽 좌표라서 값을 붙여야 하므로 기각역은 2.33이다. 정규분포표에서 Z값 찾는 법은 여기를 (참고)하면 된다.

결론을 내면, 검정통계량이 기각역 안에 있으므로 귀무가설이 기각(탈락)된다. 그러므로 A배터리의 지속시간이 더 짧다고 할 수 있다.(리고 두 모집단의 가설검정에서는, 문제처럼 좌측검정은 별로 필요가 없다. 왜냐하면 집단의 순서만 바꾸면 우측검정이 되기 때문이다. 자세한 상황은 여기 글(참고)에 있는데, 맨 밑에 있다.)

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. 김수현

    제가 듣는 수업의 프린트에는 합동 표준편차를 두 표본의 표준편차가 같은 때 쓰는 거라고 나와있는데
    또 예제에는(제가 가진 프린트의) 완전히 같은 수는 아니지만 차이가 1정도 나는 경우는 두 표준편차가 같다고 하면서 합동 표준편차를 씁니다. 그래서 제가 드리고 싶은 질문은 다음 두 가지 입니다.
    1. 합동 표준편차는 두 표본의 표준편차가 같을 때 쓴다고 말하는 게 옳은 건가요?
    2. 1번이 맞다면 같다는 의미는 완전히 같은 게 아니라 유사함을 의미하는 건가요?

    2014.12.18 09:14 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 2. 네! 생각하신 대로 완전히 같은 게 아니라, 얼추 비슷하면 같다고 하는 겁니다.

      어쨌든 별개의 집단이기 때문에, 표준편차가 정확하게 같을 수는 없습니다.



      1. 네! 합동표준편차는 두 집단의 표준편차가 서로 같을 때(비슷할 때) 사용합니다.

      그래서 만약 두 집단의 표준편차 차이가 크게 날 경우에는 따로따로 구해야 합니다.
      (그런데 이 경우는 잘 다루지 않아서, 저도 뺐습니다.)

      2014.12.18 15:12 신고 [ ADDR : EDIT/ DEL ]
  2. 궁금합니다

    2번문제와 3번문제의 차이점을 잘 모르겠습니다... 2번문제, 3번문제 둘다 표본의 분산이 주어졌는데 왜 2번문제와 3번문제 검정통계량 구하는 방법이 다른지 모르겠습니다 ㅜㅜ 만약 검정통계량을 구할 때 합동표준편차를 이용해서 구하는 것이 분산이 비슷할때 쓰는거라면 2번문제 3번문제도 분산이 비슷한데 왜 서로 풀이과정이 다른지 이해가가질않습니다...ㅜㅜ

    2016.06.04 21:05 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. ㅇㅇ

    제가 배운 내용은 두 개의 모분산이 같은지 다른지 F통계량을 사용해서 구한다고 배웠습니다 그래서 3번을 가지고 계산해봤는데 F=6/5로 계산되고 F1.2,30,11의 p-value값을 구하는 것까지 했는데 그 다음에는 어떻게 해야될지 모르겠어요 알려주세요ㅜㅜ

    2016.12.07 22:06 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 그건 "두 모분산의 가설검정"을 참고하세요.

      이글은 "분산"이 아니고, "평균" 구하는 글입니다.

      2016.12.11 15:34 신고 [ ADDR : EDIT/ DEL ]