통계2019.03.14 18:25

일원배치법 문제풀이(반복이 다른 경우)를 해보자. 먼저 일원배치법은 크게 반복이 같은 경우반복이 다른 경우로 나뉘는데, 이 반복이란 각 집단의 표본 수를 나타내는 말이다. 사실 표본을 뽑을 때, 보통 표본 수를 동일하게 뽑는 경우가 대부분이기는 하지만, 가끔가다가 표본 수가 다른 경우도 있다. 그래서 반복이 다른 경우도 알아둘 필요는 있는데, 반복이 다른 경우의 분산분석표는 아래와 같다.

 


그럼 이전 글에서 알아보았던 반복이 같은 경우와 비교해보면, 자유도가 서로 다르다. 그래서 a는 집단의 개수를 나타내고, n은 전체 표본 수를 나타내므로, 처리자유도는 a1이고 총자유도는 n1이다. 그리고 총자유도처리자유도=오차자유도이므로, 오차자유도는 (n1)(a1)=na가 된다.(참고로 SSA의 계산하는 방법도 살짝 달라지는데, 그건 계산할 때 알아보자)

 

 

 

 

1. 어느 제조업 회사에서 여러 광고에 따라 제품의 판매량이 어떻게 증가하는지를 알아보기 위하여, “신문광고” “인터넷 광고” “라디오 광고이렇게 3개의 광고를 통한 제품의 판매량 증가율을 파악한 결과 다음과 같았다. 이때 광고에 따라 제품의 판매량 증가율에 차이가 있는지를 유의수준 10%에서 검정하시오.

분산분석은 모집단 평균이 서로 같은지를 비교하는 분석이므로, 귀무가설은 세 집단의 평균은 모두 같다.”로 설정하고,(집단이 3개이므로, 가설에서 μ3까지만 표현한다) 대립가설은 적어도 하나의 평균은 다르다.”로 설정하면 된다. 참고로 평균이 같다는 것은 곧 판매량 증가율도 같다는 소리다. 그래서 귀무가설은 판매량 증가율에 차이가 없다.는 뜻이고, 대립가설은 판매량 증가율에 차이가 있다.는 뜻이다.

 


다음으로 검정통계량인 F값을 구해야 하는데, 제곱합을 계산할 때는 공식2를 사용한다고 했었다.(참고) 그래서 일단 각 표본의 합계를 구한 후, “수정항 SST SSA SSE” 순으로 구하면 되는데, 먼저 수정항 CT를 구해보면 5544.045가 나오고, SST=533.225가 나온다. 다음으로 SSA 구하는 법은 이전 글에서 알아보았던 반복이 같은 경우와 살짝 다른데, 집단마다 표본 수가 서로 다르므로, 표본 수에 맞춰서 따로따로 나눠주면 된다. 그래서 SSA=164.33이 나온다. 마지막으로 SSE는 따로 계산하지 않아도 SSTSSA를 하면 되기에, SSE=368.895가 나온다.

 



그리고 자유도에서 a는 집단의 개수를 나타내고, n은 전체 표본 수를 나타내므로, 처리자유도는 2이고, 총자유도는 17이다. 그리고 위의 제곱합과 마찬가지로, “총자유도처리자유도를 하면, 오차자유도는 15가 나온다. 또 평균제곱은 제곱합/자유도로 구하면 되는데, “처리제곱합/처리자유도를 하면 MSA=82.165가 나오고, “오차제곱합/오차자유도를 하면 MSE=24.593이 나온다. 마지막으로 검정통계량인 F값은 “MSA/MSE”를 해보면 3.34가 나온다.

 


그리고 기각역을 구해보면, 유의수준 α=0.1이고 자유도는 (2, 15)이므로,(각각 처리자유도오차자유도이다) 해당하는 값을 F분포표()에서 찾으면 기각역은 2.70이 나온다. 그럼 검정통계량이 기각역 안에 위치하므로 귀무가설이 기각(탈락)된다. 그래서 세 집단 중 적어도 하나의 평균은 다르므로 광고에 따라 제품의 판매량 증가율에는 차이가 있다는 것을 알 수 있다.



Posted by 나부랭이

댓글을 달아 주세요

  1. 지나가던버섯

    안녕하세요! 오랜만에 새글이 올라와 반가운 마음에 남겨봅니다! 나부랭이님 통계글 도움을 많이 받았습니다. 일방적으로 반갑네요 ㅎㅎ 건강하세요!

    2019.03.15 14:20 [ ADDR : EDIT/ DEL : REPLY ]