통계2014.09.01 14:08

모집단과 표본의 관계는 무엇일까? 그리고 둘의 관계 이전에 모집단(population)은 무엇이고, 표본(sample)은 무엇일까? 모집단과 표본 그리고 둘의 관계를 알아보기 위해 예를 하나 들어보자. 전국의 대학생 수가 350만 명 정도라고 할 때, 전국 대학생들의 학업만족도를 조사한다고 하자. 그런데 350만 명을 다 조사하는 게 가능할까? 350만 명을 다 조사하기에는 시간과 비용이 너무 많이 든다. 그래서 현실에서는 일부 몇 명만 뽑아서 조사를 한다.

 

또 다른 예로, 포탄을 100만 개 만들었다고 하자. 이 중에서는 불량으로 터지지 않는 포탄도 있을 것이다. 그래서 불량을 조사해야 하는데, 불량을 조사하기 위해서는 실제로 포탄을 터뜨려야만 한다면, 100만 개를 다 터뜨려야 할까? 포탄은 한 번 터지면 다시는 사용할 수 없다. 불량을 체크하기 위해 다 터뜨려야 한다면, 굳이 만들 이유도 없다. 그래서 100만 개 중 일부만 뽑아서 불량인지를 실험한다.

예와 같이 폭탄처럼 한 번 조사하고 나면 다시는 사용할 수 없는, 즉 상품가치를 잃어버리는 경우와 꼭 그런 이유가 아니더라도 현실에서는 시간과 비용의 제약으로 무엇인가를 조사할 때, 전체를 다 조사하지 않고 일부 몇 개만 뽑아서 조사하는 경우가 다반사이다. 이때 뽑은 샘플을 표본 혹은 표본집단이라 하고, 전국대학생 수 350만 명 그리고 포탄 100만 개처럼 조사하고자 하는 대상 전체를 모집단이라고 한다.

 

표본은 모집단에서 일부만 뽑아서 조사하는 것이기 때문에, 샘플로 뽑는 표본의 양(n)이 많으면 많을수록, 데이터의 신뢰도는 올라간다. 그리고 모집단의 통계수치를 모수라고 하고, 표본의 통계수치를 통계량이라고 한다.

Posted by 나부랭이

댓글을 달아 주세요

  1. jsa

    모집단에서 샘플을 뽑을때에는 모집단의 현상을 반영하게끔 잘 뽑혔으면 하는 바램이 있는 것이군요.
    모집단이 정규분포를 따르면 샘플 또한 정규분포를 따른다는 바램
    모집단이 지수분포를 따른다면 샘플 또한 지수분포를 따른다는 바램
    보통 연속형 데이터의 경우 정규분포를 따르기에 샘플의 정규성 검정을 통해 P값 >0.05 임을 확인하는 것이구요

    모집단이 정규분포를 따르지 않는데 굳이 샘플의 정규성 검정을 할 필요는 없는 것이고요.
    보통의 경우 연속성 데이터가 정규분포를 따른다고 가정한다는 것이 중요하군요.

    2016.09.22 12:30 신고 [ ADDR : EDIT/ DEL : REPLY ]