통계2014.12.06 18:46

모평균의 가설검정 개념정리(σ를 모르는 경우)를 해보자. 이전 포스팅에서는 σ를 아는 경우에 대해서 알아보았는데, 이번에는 σ를 모르는 경우에 대해서 알아보자. 사실 무엇인가를 조사할 때, 모표준편차인 σ를 아는 경우는 흔치 않다. 그래서 모수를 모르기에 표본의 통계량을 사용하는데, σ를 모르는 경우에는 표본에서 얻어낸 표본표준편차 s를 사용한다.

 

 

그리고 σ를 아는 경우에는 정규분포를 사용한다고 했는데, σ를 모르는 경우에는 t분포를 사용한다. 그런데 t분포로 확률을 구하는 것이 아니라, 단지 그래프의 x축 좌표를 구하는 데 활용할 뿐이다.(기각역과 검정통계량을 구할 때 사용한다.)

 

 

 

그런데 t분포는 표본의 수 n30이면, 정규분포와 값이 비슷해지기에 t분포 대신 정규분포를 사용할 수가 있다. 그런데 n30이면 정규분포나 t분포나 값은 서로 비슷하기에, 꼭 정규분포를 사용해야 되는 것은 아니다. 하지만 t분포표가 표본 31개 이하의 값 위주로 구성되어 있어서, 표본이 많아지면 사용할 수가 없다. 그래서 30개 이상이면 정규분포를 사용하자.(기준을 31개로 하지 않는 이유는, 기준으로 쓰기에는 31개보단 30개가 보기에 편하기 때문이다.)

 

 

그런데 정규분포를 사용할 때 검정통계량 공식이 약간 바뀐다. 아무래도 모표준편차인 σ를 모르는 상태이기 때문에, 공식의 σ표본표준편차 s로 대체된다. 그래서 t분포와 정규분포의 검정통계량 공식은 같아진다. 그럼 다음 포스팅에서는 모평균의 가설검정(σ를 모르는 경우) 문제풀이를 해보자.

 

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. 잘보고있슴다 ㅋㅋ 책보다 이해가 훨씬 쉬워서 책은 안보고 님 블로그만 보내요 ㅋㅋ

    p값 구하는건데
    t=1.29(검정통계량)이고 a=0.1. 정규분포를 하고있는데

    p를 구하려니까
    p=p(t<-1.29) + p(t>1.29)
    = 0.10 + 0.10
    = 0.2
    = p >a = do not rejection
    이렇게 나오는데 0.10 은 도대체 어디서 나오는 건가요? 표준정규분포표에서 -1.29를 찾으면 .0985, 1.29를 찾으면 .9015
    이렇게 나오는데 ㅠㅠ

    2014.12.07 16:16 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • t=1.29(검정통계량)

      검정통계량이 t통계량이므로 t분포표에서 찾아야 합니다.

      그래서 1.29에 해당하는 값을 t분포표에서 찾으면,

      1.289가 가장 가까운 것을 알 수 있습니다.(자유도는 120이고, α는 0.1)

      이때 이 t값에 해당하는 확률이 0.1입니다.(α=0.1)



      그리고 표본의 수가 커서, 정규분포를 사용해도 될 것 같네요.

      -1.29가 0.0985라고 하셨는데,

      0.0985를 반올림하면 0.1이 됩니다.

      2014.12.08 13:51 신고 [ ADDR : EDIT/ DEL ]
  2. 나부랭이팬

    카이를 모르는경우 t식의 유도과정을 알고싶습니당!
    분모중 표준편차를 사용하는경우 자유도가n-1이기 때문에 n-1을 나눠줘야한다고 알고 있는데
    왜 n을 나눠준건지 자세한 설명부탁드릴게요!
    항상 감사합니다~

    2014.12.17 22:06 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 확률분포식 유도 과정은 저도 들여다보질 않아서요 ~_~;;

      그런데 t식 유도할 때, n-1은 서로 상쇄돼서 없어집니다.

      그리고 n은 상쇄되지 않고 끝까지 살아남기 때문에,

      최종적으로 공식에 n이 있는 겁니다.



      "왜 n를 나눠준건지" <- 이 문장이 정확하게 뭘 물어보시는 건지를 모르겠네요.

      2014.12.18 14:58 신고 [ ADDR : EDIT/ DEL ]
  3. 궁금

    쉽게 설명해주신 포스팅 잘 봤습니다.
    모표준편차를 모르고 n이 클 때 정규분포를 따르는 이유는
    중심극한정리에 의한 것인가요???

    2016.01.13 15:03 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 그냥 상식적으로 생각해서 표본이 많으면,

      평균 근처에 있는 값들은 그 수가 많고,

      평균에서 멀리 떨어져 있는 곳에 있는 값들은 그 수가 적습니다.

      이렇게 단순하게 생각하면 그뿐일 뿐,

      굳이 거창하게 "중심극한정리"를 거론할 이유는 없어 보이네요.

      2016.01.14 14:13 신고 [ ADDR : EDIT/ DEL ]
  4. 학생22

    표본의표준편차 s는 어떻게 구해야하나요??
    문제지문에 표본의개수와. 표본의크기 그리고 제곱합만주어졌을때 표본의표준편차 s 구하는 공식이 궁금해요

    2017.02.17 03:23 신고 [ ADDR : EDIT/ DEL : REPLY ]