통계2015.01.18 19:28

상관계수 계산하는 법을 알아보자. 통계의 여러 계산 중, 표본분산 구하는 일은 굉장히 귀찮은 과정이다. 그런데 상관계수는 표본분산을 기본 바탕으로 하기에, 계산하기가 굉장히 귀찮다. 그리고 상관계수는 모상관계수와 표본상관계수가 있지만, 실질적으로 모상관계수를 구할 일은 거의 없다. 그래서 표본상관계수를 구하는 경우가, 대부분이라고 생각해도 된다.(어차피 공식은 같다.)

 

 

 

1. 어느 회사에서는 영업사원들의 지각횟수와 제품의 판매횟수가 서로 상관이 있는지를 알아보려고 한다. 그래서 영업사원 5명을 대상으로, 한 달 동안 지각횟수와 판매횟수를 조사하였더니 아래와 같이 나왔다고 한다. 이때 상관계수를 구하고, 상관관계가 어느 정도인지를 파악하라.

지각횟수(x):     1     2     3     4     5

판매횟수(y):     8     7     6     4     5

일단 변수 x의 평균은 3이고, 변수 y의 평균은 6이다. 그래서 상관계수를 구해보면 r=0.9가 나오는데, -1에 가까우므로 지각횟수와 판매횟수의 상관관계는 매우 높다고 할 수 있다.(음의 상관관계가 매우 높다.)

 

 

 

2. 어느 공장의 품질부서에서는, 작업자들이 교육을 많이 받을수록 생산량이 많아지는지를 조사 중인데, 먼저 교육받은 횟수 생산량의 상관관계를 조사한다고 한다. 이에 과거의 데이터를 분석해보니 데이터는 아래와 같이 나왔다고 한다. 이때 상관계수를 구하고, 상관관계가 어느 정도인지를 파악하라.

교육받은 횟수(x):     1       3       5      7

생      산      량(y):     35     45     35    45

일단 변수 x의 평균은 4이고, 변수 y의 평균은 40이다. 그래서 상관계수를 구해보면 r=0.45가 나오는데, 상관관계를 판단하기에는 수치가 좀 애매하다. 그래도 결과를 내보면, 교육받은 횟수와 생산량은 서로 상관관계가 있기는 하다.(양의 상관관계가 있다.)

 

 

 

그런데 위 2번 문제와 같이 상관계수가 어중간하게 나오면, 결과를 해석하기가 좀 애매하다.(그림도 애매하게 나왔다.) 물론 아래와 같이 세부적으로 상관관계의 정도를 나눠놓은 기준이 있지만, 눈대중으로 나눠놓은 것이라서 기준으로 사용하기에는 못 미덥다.

 

 

또 상관분석은 변수에 따라서 치우침이 다른 경우가 많은데, 변수의 특성상 치우침이 상대적으로 작아서 상관계수가 크게 나오는 경우가 있는 반면, 치우침이 상대적으로 커서 상관계수가 작게 나오는 경우도 있다. 그래서 위의 기준이 잘 안 들어맞는 경우가 생기는데, 그래서 추가로 가설검정으로 결과를 해석하기도 한다. 그럼 다음 글에서는 상관계수의 가설검정에 대해서 알아보자.

저작자 표시 비영리 변경 금지
신고

'통계' 카테고리의 다른 글

상관계수의 가설검정 문제풀이  (0) 2015.01.22
상관계수의 가설검정 개념정리  (4) 2015.01.21
상관계수 계산하는 법  (0) 2015.01.18
상관계수 구하는 법  (8) 2015.01.17
상관계수란?  (24) 2015.01.15
상관분석이란?  (10) 2015.01.14
Posted by 나부랭이

댓글을 달아 주세요