통계2014.12.10 18:45

두 모평균의 가설검정 문제풀이(σ를 아는 경우)를 해보자. 가설검정에서는 여러 확률분포를 사용하는데, 이 중 정규분포가 가장 사용하기에 편하다. 왜냐하면 기각역을 구할 때, 다른 확률분포들은 자유도에 따라 값이 달라지므로 매번 표를 찾아야 하는 번거로움이 있지만, 정규분포는 자유도가 없어서 자주 사용하는 기각역이 몇 개로 한정되어 있다. 그래서 이번에는 표에서 Z값을 찾는 법은 다루지 않겠다. 표에서 Z값을 찾는 법은 여기를 (참고)하면 된다.

 

 

 

 

1. 최근 들어서 지역1과 지역2 주민들이 벌어들이는, 월평균소득이 차이가 나고 있다는 의견이 나오고 있다. 실제로 그러한지를 알아보기 위해 각각 100개와 90개 가구를 조사하였더니, 지역1의 월평균소득은 240만 원이 나왔고 지역2의 월평균소득은 230만 원이 나왔다고 한다. 이때 두 지역의 월평균소득이 차이가 나는지를 유의수준 10%에서 검정하시오. 단 지금까지의 데이터를 분석해보니, 지역1의 모표준편차는 60이고, 지역2의 모표준편차는 70이라고 한다.

대립가설로 월평균소득이 차이가 나고 있다는 의견이 나왔는데, 어느 지역이 더 작은지 큰지는 거론되지 않았다. 그래서 대립가설을 같지 않다로 설정한다. 그리고 검정통계량을 구해보면 1.05가 나온다.

                                                              

그럼 기각역을 구해보자. 일단 유의수준 α=0.1인데, 양측검정이므로 α/2=0.05에 해당하는 Z1.64를 사용해야 한다. 그런데 양쪽으로 설정해야 하므로, 기각역은 ±1.64가 된다.

결론을 내보면, 검정통계량이 채택역 안에 위치하므로 귀무가설이 채택된다. 그러므로 두 지역의 월평균소득은 차이가 난다고 할 수 없다.

 

 

 

2. 두 개의 건전지 AB가 있는데, A건전지의 평균수명이 100일 더 길다고 한다. 하지만 일부에서는 A건전지의 평균수명이 B건전지 보다 100일을 초과하여 더 길다는 의견이 나오고 있다. 실제로 그러한지를 알아보기 위해 각 건전지 50개와 60개 뽑아 조사하였더니, A건전지의 평균수명은 470일이 나왔고, B건전지의 평균수명은 360일이 나왔다고 한다. 이때 A건전지의 평균수명이 100일을 초과하여 더 길다고 할 수 있을지 유의수준 5%에서 검정하시오. 단 지금까지의 데이터를 분석해보니, A건전지의 모표준편차는 20이고, B건전지의 모표준편차는 30이라고 한다.

보통 가설을 설정할 때 μ1-μ2=0로 설정하는데, 왜냐하면 귀무가설로 μ1μ2가 같다라고 설정하는 경우가 많기 때문이다. 그래서 0인 것이다. 하지만 위의 문제는 원래부터 μ1 μ2가 같은 것이 아니라, 100일의 차이가 있었다. 그래서 이렇게 응용된 문제에서는 0 대신 100을 넣어야 한다. 그렇기에 이 문제의 가설은 μ1-μ2=100이라고 설정하는데, A건전지가 100일 더 길기 때문에 +100인 것이다. 만약 B건전지가 100일 더 길 다면 100이 되었을 것이다.(이 부분이 헷갈린다면 이전 포스팅의 뺄셈을 활용한 두 집단의 관계를 읽어 보면 된다.) 그럼 가설을 세워보자. 일단 대립가설로 A건전지가 100일을 초과하여 더 길다는 의견이 나오므로, 대립가설은 μ1이 더 크다로 설정한다. 그리고 μ1-μ2=100이기 때문에, 검정통계량의 μ1-μ20 대신 100이 들어가는데, 검정통계량을 구해보면 2.09가 나온다.

                                                              

그리고 기각역을 구해보자. 유의수준 α=0.05인데 0.05에 해당하는 Z값은 1.64이다. 그래서 기각역은 1.64이다.

결론을 내면, 검정통계량이 기가역 안에 있으므로 귀무가설이 기각(탈락)된다. 그러므로 A건전지의 평균수명이 100일을 초과하여 더 길다고 할 수 있다.

 

 

 

3. 체크카드를 사용하면 신용카드를 사용할 때보다, 카드 사용액이 더 낮아진다는 의견이 나오고 있다. 실제로 그러한지를 알아보기 위해 각 카드사용자 100명과 120명의 카드 사용액을 조사해보니, 체크카드 평균 사용액은 50만 원이었고, 신용카드 평균 사용액은 100만 원이었다. 이때 체크카드를 사용하면 카드 사용액이 더 낮아진다고 할 수 있는지 유의수준 1%에서 검정하시오. 단 지금까지의 데이터를 분석해보니, 체크카드 사용액의 모표준편차는 5이고, 신용카드 사용액의 모표준편차는 30이라고 한다.

대립가설로 체크카드를 사용하면 카드 사용액이 더 낮아진다는 의견이 나오므로, 대립가설은 μ1이 더 작다로 설정한다. 그리고 검정통계량을 구해보면 17.96이 나오는데, 딱 봐도 왼쪽으로 치우친 값이라서 굳이 기각역과 비교해보지 않아도 귀무가설이 기각(탈락)이라는 것을 알 수 있다. 또 이런 극단적인 값이 나오는 경우에는, 굳이 가설검정을 하지 않고도 더 낮다고 판단할 수가 있다.

                                                              

이미 판단은 끝났지만 기각역을 한 번 구해보자. 유의수준 α=0.01인데 0.01에 해당하는 Z값은 2.33이다. 그런데 왼쪽 좌표라서 값을 붙여야함으로 기각역은 2.33이다.

결론을 내면, 검정통계량이 기각역 안에 있으므로 귀무가설이 기각(탈락)된다. 그러므로 체크카드를 사용하면 카드 사용액이 더 낮아진다고 할 수 있다.

 

 

 

두 모집단의 가설검정에서는 위 3번 문제와 같이 좌측검정은 별로 필요가 없다. 왜냐하면 집단의 순서만 바꾸면 우측검정이 되기 때문이다. 예를 들어 3번 문제에서 집단의 순서를 서로 바꿔서 검정통계량을 구해보면 17.96이 나오는데, -+로 바뀌면서 우측검정이 되는 것을 알 수 있다.(기각역도 마찬가지이다.) 그래서 두 모집단의 가설검정에서는 좌측검정 대신 우측검정 사용해도 된다.(좌측검정보다 우측검정이 계산하기가 좀 더 편하다. 특히 두 모분산을 검정할 때, 좌측검정보다 우측검정이 훨씬 편하다.)

                         

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요