통계2014.12.03 18:20

모평균의 가설검정 개념정리(σ를 아는 경우)를 해보자. 모평균(μ)의 가설을 검정할 때는, 크게 σ를 아는 경우σ를 모르는 경우로 나뉘는데, 이번에는 σ를 아는 경우에 대해서 알아보자. 사실 무엇인가를 조사할 때, 모표준편차인 σ를 아는 경우는 거의 없다. 하지만 기업이나 특정 조사기관에서는 수십 년에 걸쳐서 자료를 수집하기도 하는데, 이런 데이터를 모수로 취급하기도 한다.

예를 들어, 조사를 하는데 표본 30개를 뽑아서 얻어낸 표준편차보다는, 기존에 수십 년에 걸쳐서 수집한 표본 수백 개 혹은 수천 개에서 얻어낸 표준편차가 훨씬 더 정확하다. 그래서 이렇게 오랜 시간에 걸쳐서 얻어낸 표준편차가 모표준편차는 아니지만, 데이터의 신뢰성이 높기에 모표준편차로 취급하는 것이다. 정확하게는 모수 아닌 모수이다.(표현이 좀 이율배반적이기는 하다.) 그래서 이런 데이터를 사용하면 σ를 아는 경우가 가능하다.

 

그리고 가설검정은 귀무가설과 대립가설 중에서 하나를 양자택일한다고 했다. 그래서 가설을 세울 때는 수치를 통일해야 하는데, 왜냐하면 수치가 다르면 전혀 별개의 가설이 되어 버리기 때문이다.(표본으로 얻어낸 표본평균이, 대립가설의 평균이라고 오해하기가 쉽다.) 그래서 수치를 통일해야 하는데, 그냥 귀무가설을 기준으로 한다고 생각하면 편할 것이다.(원래부터 대립가설의 평균도 귀무가설과 동일하다. 단지 헷갈릴 뿐)

 

 

모평균의 가설검정은 모평균(μ)을 모르기에, 모평균에 대한 가설을 검정하는 것이다. 그런데 모평균을 모르는 상태인데도 불구하고, 검정통계량 공식을 보면 모평균 μ가 있다. 그래서 말이 안 되는 상황 같지만, μ는 실제의 모평균이 아니라 가설 속의 모평균이다.

 

 

그래서 일부에서는 μ0라고 표기하기도 한다. 하지만 이 μ0두 모집단일 때는 사용할 수가 없다. 그리고 기호를 단순화하기 위해서 그냥 μ라고 표기하겠다.(μ0가 더 정확하기는 하다.)

 

 

그리고 가설검정도 신뢰구간과 마찬가지로 각각에 맞는 확률분포를 사용하는데, σ를 아는 경우에는 정규분포를 사용한다. 그런데 정규분포로 확률을 구하는 것이 아니다. 단지 그래프의 x축 좌표를 활용하는데, 기각역과 검정통계량을 구할 때 사용한다. 그리고 여러 가설검정(모평균, 모분산, 모비율)에 사용하는 확률분포가 신뢰구간이랑 정확하게 겹치고, 기본 개념도 비슷한 점이 많아서 신뢰구간에 어느 정도 익숙해졌다면 크게 어려울 건 없을 것 같다.

모평균 두 모평균 모분산 두 모분산 모비율 두 모비율

예전에 신뢰구간을 다룰 때 위의 순서대로 글을 올렸었는데, 가설검정도 이 순서대로 올릴 예정이다. 그럼 다음 포스팅에서는 모평균의 가설검정(σ를 아는 경우) 문제풀이를 해보자.

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. 비밀댓글입니다

    2014.12.05 13:18 [ ADDR : EDIT/ DEL : REPLY ]