통계2019.03.28 18:09

이원배치법 문제풀이(반복이 있는 경우)를 해보자. 먼저 이원배치법에서 반복으로 여러 개의 표본을 뽑았을 때, 두 요인의 각 집단이 서로 영향을 주고받으면서 동시에 평균에 영향을 주는 것을 상호작용이라고 하는데, 반복이 있는 경우에는 상호작용에 해당하는 값들을 추가로 구해주면 된다. 그리고 반복이 있는 경우의 분산분석표는 아래와 같다.

 


 

 

 

1. 어느 공장에서 4대의 기계3명의 작업자에 따라 제품의 생산량에 차이가 있는지를 파악하기 위하여, 3번의 반복 실험을 한 결과 다음과 같이 나왔다. 이때 기계와 작업자에 따라 제품의 생산량에 차이가 있는지를 유의수준 5%에서 검정하시오.

일단 이원배치법의 반복이 있는 경우는 가설을 3개 세워야 하는데, 먼저 첫 번째 요인(기계)은 집단이 4개이므로 첫 번째 가설은 μ4까지 표현하고, 두 번째 요인(작업자)은 집단이 3개이므로 두 번째 가설은 μ3까지 표현한다.(참고로 평균이 같다는 것은 곧 제품의 생산량도 같다는 소리다. 그래서 귀무가설은 생산량에 차이가 없다.”는 뜻이고, 대립가설은 생산량에 차이가 있다.”는 뜻이다) 마지막으로 상호작용에 관한 가설을 세우면 되는데, 귀무가설은 두 요인 사이에 상호작용이 없다.”라고 세우고, 대립가설은 두 요인 사이에 상호작용이 있다.”라고 세우면 된다.

 


다음으로 반복이 있는 경우는 검정통계량인 F값도 3개를 구해야 하는데, 제곱합을 계산할 때는 공식2를 사용한다고 했었다.(참고) 그리고 반복이 있는 경우는 표본의 특성상 계산 할 때 표가 2개 있는 것이 편하다. 그래서 추가로 반복된 표본끼리의 합계인 Tab로 구성된 표를 1개 더 그린 후,(TabSSAB를 구한다) “수정항 SST SSAB SSA SSB SSA×B SSE” 순으로 구하면 되는데, 먼저 수정항 CT=42025가 나오고, SST=477이 나온다. 다음으로 SSAB=242.3333이 나오고, SSA=41.4444가 나오며, SSB=129.1667이 나온다. 마지막으로 SSA×B는 따로 계산하지 않아도 SSABSSASSB를 하면 되기에 SSA×B=71.7222가 나오고, SSE도 따로 계산하지 않아도 SSTSSASSBSSA×B를 하면 되기에 SSE=234.6667이 나온다.

 




그리고 자유도에서 a는 첫 번째 요인의 집단 수를 나타내고, b는 두 번째 요인의 집단 수를 나타내며, r은 두 요인의 각 집단이 서로 만나는 곳의 표본 수(반복한 횟수)를 나타내므로, 처리자유도(A)3이고 처리자유도(B)2이다. 그리고 상호자유도는 6이며 총자유도는 35이다. 그리고 위의 제곱합과 마찬가지로, “총자유도처리자유도(A)처리자유도(B)상호자유도를 하면, 오차자유도는 24가 나온다. 또 평균제곱은 제곱합/자유도로 구하면 되는데, “처리제곱합(A)/처리자유도(A)”를 하면 MSA=13.8148이 나오고, “처리제곱합(B)/처리자유도(B)”를 하면 MSB=64.5834가 나온다. 그리고 상호제곱합/상호자유도를 하면 MSA×B=11.9537이 나오고, “오차제곱합/오차자유도를 하면 MSE=9.7778이 나온다. 그래서 첫 번째 요인의 F값은 “MSA/MSE”를 해보면 1.41이 나오고, 두 번째 요인의 F값은 “MSB/MSE”를 해보면 6.61이 나온다. 그리고 상호작용의 F값은 “MSA×B/MSE”를 해보면 1.22가 나온다.

 


그런데 F값이 3개이므로 기각역도 3개를 구해야 하는데, 먼저 첫 번째 요인의 기각역을 구해보면, 유의수준 α=0.05이고 자유도는 (3, 24)이므로,(각각 처리자유도(A)”오차자유도이다) 해당하는 값을 F분포표()에서 찾으면 첫 번째 요인의 기각역은 3.01이 나온다. 그럼 첫 번째 요인의 검정통계량은 채택역 안에 위치하므로, 첫 번째 가설에서는 귀무가설이 채택된다. 그래서 첫 번째 요인의 집단들은 평균이 모두 같으므로 기계에 따라 제품의 생산량에는 차이가 없다는 것을 알 수 있다.

 


또 두 번째 요인의 기각역을 구해보면, 유의수준 α=0.05이고 자유도는 (2, 24)이므로,(각각 처리자유도(B)”오차자유도이다) 해당하는 값을 F분포표에서 찾으면 두 번째 요인의 기각역은 3.40이 나온다. 그럼 두 번째 요인의 검정통계량은 기각역 안에 위치하므로, 두 번째 가설에서는 귀무가설이 기각(탈락)된다. 그래서 두 번째 요인의 집단 중 적어도 하나의 평균은 다르므로 작업자에 따라 제품의 생산량에는 차이가 있다는 것을 알 수 있다.

 


마지막으로 상호작용의 기각역을 구해보면, 유의수준 α=0.05이고 자유도는 (6, 24)이므로,(각각 상호자유도오차자유도이다) 해당하는 값을 F분포표에서 찾으면 상호작용의 기각역은 2.51이 나온다. 그럼 상호작용의 검정통계량은 채택역 안에 위치하므로, 세 번째 가설에서는 귀무가설이 채택된다. 그래서 두 요인 사이에 상호작용이 없다는 것을 알 수 있다.



Posted by 나부랭이

댓글을 달아 주세요

  1. 통계초보

    분산분석 내용 정말 쉽게 설명되어 있어서 작성자블로그보고 다 이해해서 갑니다. ㅎㅎ

    정말 감사합니다. 주소 저장해놨어요 ^^

    2019.05.06 17:49 [ ADDR : EDIT/ DEL : REPLY ]