통계2014.11.12 19:00

모분산의 신뢰구간 구하는법을 알아보자. 보통 우리가 무엇인가를 만들거나 분석을 할 때 치우침이 작으면 작을수록 좋다. 왜냐하면 무엇인가를 만들 때 치우침이 크면, 그것은 곧 불량품이 되어버린다. 그리고 무엇인가를 분석할 때 치우침이 크면, 그것은 곧 데이터의 오류로 이어지기 때문이다. 그래서 치우침을 파악하는 일이 대단히 중요한데, 이 치우침을 표현하는 통계의 대표적인 기호가 분산이다. 그래서 모분산을 추리하는 것은 곧 집단의 치우침을 추리하는 것이다. 일단 모분산의 추정은 표본을 뽑아서 얻어낸 표본분산(s2)으로 모분산(σ2)을 추리하는 것인데, 그럼 모분산의 신뢰구간 구하는 법을 알아보자.

일단 신뢰구간을 추정할 때는 확률분포를 사용한다고 했는데, 보통 분산을 다루는 분포가 카이제곱분포이기에, 모분산 추정에는 카이제곱분포(χ2)를 사용한다. 그리고 신뢰구간의 길이는 카이제곱분포 그래프의 x축 좌표를 활용하는데, 모평균 추정과 마찬가지로 모수가 신뢰구간 안에 포함되지 않을 확률 α를 사용한다. 그런데 α가 양쪽으로 나뉘기 때문에 α/2가 되고, α/2에 해당하는 그래프의 x축 좌표는 다음과 같다.(참고)

 

 

그리고 신뢰구간을 구하기 위해서는, 양쪽 x축 좌표와 함께 카이제곱통계량(χ2통계량) 공식도 알아야 한다. χ2통계량 역시 그래프의 x축 좌표를 구하는 카이제곱분포의 대표적인 공식인데, 나중에 가설검정에서도 사용되는 공식이다. 공식은 다음과 같다.

χ2통계량과 α/2에 해당하는 x축 좌표를 활용하면 신뢰구간 공식을 유도할 수가 있는데, 모분산(σ2)을 추정하는 것이기 때문에, σ2을 중심으로 공식을 재배열하면 된다. 재배열해서 얻어낸 신뢰구간 공식은 다음과 같은데, 그럼 다음 포스팅에서는 문제풀이를 해보자.

저작자 표시 비영리 변경 금지
신고
Posted by 나부랭이

댓글을 달아 주세요

  1. 신뢰구간 공식이요

    신뢰구간 공식이요, 왼쪽 오른쪽 바뀐거 아닌가요?

    2015.05.22 14:24 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 역수 취할 때 바뀌는 겁니다.

      아마 문제를 직접 풀어보시면,

      이해하기가 한결 편해질 겁니다ㅋㅋ

      2015.05.22 14:29 신고 [ ADDR : EDIT/ DEL ]
    • 1<x<10

      역수 취하면

      1/1 > 1/x > 1/10

      정리하면
      0.1 < 1/x < 1

      이런 원리죠.

      2016.12.26 20:15 신고 [ ADDR : EDIT/ DEL ]
  2. urimago

    질문있습니다!
    모평균을 아는 상황에서 모분산을 추정할 때 카이제곱분포를 활용하잖아요?
    이 때, 카이제곱분포 대신 표준정규분포를 사용하지 않는 이유는 뭘까요?
    Z라는 값도 모수가 모평균, 모분산 두개 들어가고, 둘 중 하나를 알면 나머지 추정할 수 있는것 같은데요. 계산이 더 복잡해지기 때문인가요?

    (같은 논리로, 모분산을 아는 상황에서 모평균을 추정할때는 카이제곱분포를 사용하지 않는 이유도 궁금합니다.)

    2016.07.04 15:38 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 여러 개의 평균을 뽑았을 때,

      이 평균들이 퍼져 있는 모습은 정규분포를 닮았습니다.

      그래서 정규분포를 사용합니다.



      마찬가지로 여러 개의 분산을 뽑았을 때,

      이 분산들이 퍼져 있는 모습은 카이제곱분포를 닮았습니다.

      그래서 카이제곱분포를 사용합니다.



      애초에 퍼져있는 모습이 다르기 때문에,

      분산을 추정할 때, 정규분포를 사용하지 않습니다.

      2016.07.04 15:50 신고 [ ADDR : EDIT/ DEL ]
  3. urimago

    아.. 알듯말듯 하네요 ㅠㅠ
    저는

    [표본 50개를 뽑았고 모평균을 알고있는 상황에서, 모분산을 추정하기 위해 표준정규분포를 사용한다고 하면
    a < (Xbar-μ)/σ < b
    여기에서 Xbar와 μ는 아는 상황이기 때문에 가운데에 σ만 남도록 식을 정리하면 모표준편차에 대한 구간이 나오므로 모분산의 구간도 추정할 수 있겠다.]

    이런식으로 생각했거든요.
    제 생각에 어떤 오류가 있는지, 위에 답변해주신 것과 다른 방식 혹은 자세한 설명 부탁드려도 될까요?

    2016.07.06 14:27 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 뭐.. 꼭 오류가 있다고는 할 수 없습니다.

      그러니 한 번 그렇게 계산해보세요.

      값이 어떻게 나올지는 모르겠지만요~

      2016.07.07 15:10 신고 [ ADDR : EDIT/ DEL ]
  4. Pablo

    분산은 카이제곱 분포를 나타내서 카이제곱분포를 쓴다고 하셨는데,

    n이 100, 200, 500, 1000이 되도 카이제곱 분포를 써도 무방한가요?

    2017.03.08 11:40 신고 [ ADDR : EDIT/ DEL : REPLY ]