통계2014.10.26 23:50

F분포표 보는 법을 알아보자. F분포도 다른 표본분포(t분포, 카이제곱분포)들과 마찬가지로 직접 확률을 구할 때 사용하는 분포가 아니라, 신뢰구간이나 가설검정 그리고 분산분석 시 사용하는 분포다. 그리고 F분포로 신뢰구간, 가설검정, 분산분석을 할 때는 F값을 알아야 하는데, F값을 구하는 방법이 F분포표를 활용하는 것이다. 그래서 F분포표는 F값을 중심으로 표가 구성되어 있는데, F분포표는 다음과 같다. 클릭하면 그림이 커진다.

 

 

 

 

 

 

F분포는 이전에 다루었던 카이제곱분포와 마찬가지로, 분산을 처리할 때 사용하는 분포다. 하지만 카이제곱분포와 다른 점이 있다면, 카이제곱분포는 한 집단의 분산을 다루지만, F분포는 두 집단의 분산을 다룬다. 그래서 집단이 2개이므로 자유도도 2개가 있는데, 보통 표의 x축은 분자의 자유도(n1-1)를 다루고 y축은 분모의 자유도(n2-1)를 다룬다. 그리고 α는 카이제곱분포표와 마찬가지로 그래프의 오른쪽면적에 해당하고, F값은 그래프의 오른쪽 x축 좌표를 나타낸다.

 

 

그런데 두 개의 집단 중에서, 어느 것이 분자이고 어느 것이 분모인지를 헷갈릴 수가 있는데, 보통 분산이 더 큰 집단이 분자가 되고 상대적으로 분산이 작은 집단이 분모가 된다.

 

 

분산이 더 큰 집단이 분자로 가는 이유는, 바로 그래프의 오른쪽면적을 사용하기 위해서이다. F분포는 1을 기준으로 왼쪽면적과 오른쪽면적으로 나눌 수 있는데,(자유도에 따라 그래프의 모양이 달라지므로, 1의 정확한 위치는 없다.) 그렇다면 왼쪽면적은 1보다 작은 수를 나타내고, 오른쪽면적은 1보다 큰 수를 나타낸다. 그래서 오른쪽면적을 사용하기 위해서는 F통계량(가설검정과 분산분석에서 사용되는 통계량)이 항상 1보다 크게 나와야 하는데,(혹은 같거나) 분자에 더 큰 값을 놓으면 1보다 큰 값이 나오기에 분산이 더 큰 집단이 분자가 된다.

 

 

그리고 이렇게 오른쪽면적에 집착하는 이유는 바로 분산분석 때문이다. F분포는 대부분 분산분석에서 활용되는 분포로, 분산분석에서는 그래프의 오른쪽면적을 자주 사용할 뿐, 왼쪽면적은 잘 사용하지 않는다. 그래서 표의 구성도 편의상 오른쪽면적으로만 구성되어있다. F분포표를 분석해보면 가장 작은 값은 항상 1이다. 즉 왼쪽 면적은 다루지 않는다. 그래서 F분포는 왼쪽면적보다는 오른쪽면적이 사용하기에 훨씬 편하다.

 

 

그렇다고 F분포가 오른쪽면적만 사용하는 것은 아니다. 가끔가다가 왼쪽면적을 사용하는 경우가 있는데, 그럼 왼쪽 F값 구하는 법을 알아보자. 일단 F분포가 카이제곱분포와 비슷하기에, 카이제곱분포처럼 1-α로 구하면 될 것 같지만, 표의 특징상 1-α로는 왼쪽 좌표를 구할 수가 없다. 카이제곱분포표의 경우에는 큰 확률도 다루기에 1-α로 왼쪽 좌표를 구할 수 있지만, F분포표의 경우에는 작은 α만 다루기에 1-α로는 왼쪽 좌표를 구할 수가 없다.(F분포에서는 1-α 혹은 1-α/2는 생각 안 하는 게 더 좋을 수 있다. 오히려 이것 때문에 더 헷갈릴 수 있다.)

 

 

그래서 왼쪽 F값은 1-α로 구하는 것이 아니라 역수를 취해서 구하는데, 한 가지 주의해야 할 것은 분자와 분모의 자유도가 서로 바뀐다. 이점을 주의해야 하는데, 왼쪽 F값은 다음과 같다.

 

 

그리고 신뢰구간 추정에서 양쪽 F값을 구하는 경우도 있는데, 이때 α가 양쪽으로 나뉘기 때문에 α/2가 된다. 그래서 양쪽 F값은 다음과 같다. 그럼 몇 가지 문제를 풀어보자.

 

 

 

1. 두 집단 AB가 있는데, 집단 A의 표본분산 s2=20이고 n=9라고 한다. 그리고 집단 B의 표본분산 s2=30이고 n=6이라고 한다. 이때 α=0.1에 해당하는 F값을 구하여라.

집단 B의 분산(s2)이 더 크므로, B가 분자가 되고 A가 분모가 된다. 그래서 n1-1=5이고, n2-1=8이다. 그래서 α=0.1에 해당하는 F값을 찾으면 2.73이 나온다.

                         

 

 

2. 집단 A의 표본분산 s2=23이고 n=6이라고 하고, 그리고 집단 B의 표본분산 s2=15이고 n=5라고 한다. 이때 α=0.05에 해당하는 왼쪽 F값을 구하여라.

집단 A의 분산이 더 크므로, A가 분자가 되고 B가 분모가 된다. 그래서 n1-1=5이고, n2-1=4이다. 그런데 왼쪽 F값이기 때문에 분자와 분모의 자유도가 서로 바뀐다. 그래서 α=0.05에 해당하는 값을 표에서 찾으면 5.19가 나오는데, 1/F를 해야 하므로 왼쪽 F값은 1/5.19=0.19가 된다.

                         

 

 

3. 집단 A의 표본분산 s2=60이고 n=8이라고 한다. 그리고 집단 B의 표본분산 s2=40이고 n=7이라고 한다. 이때 α=0.01에 해당하는 양쪽 F값을 구하여라.

일단 양쪽 F값이므로 α/2=0.005이다. 그리고 집단 A의 분산이 더 크므로, A가 분자가 되고 B가 분모가 되는데, 그래서 n1-1=7이고 n2-1=6이다. 일단 해당 값을 표에서 찾으면 오른쪽 F값은 10.79가 된다. 그리고 왼쪽 값은 일단 표에서 찾으면(자유도가 서로 바뀐다.) 9.16이 되는데, 1/F를 해야 하므로 왼쪽 F값은 1/9.16=0.11이 된다.

     

저작자 표시 비영리 변경 금지
신고

'통계' 카테고리의 다른 글

점추정과 구간추정의 차이는?  (4) 2014.10.28
통계적 추정이란?  (9) 2014.10.27
F분포표 보는 법!  (39) 2014.10.26
F분포 개념정리!  (12) 2014.10.23
카이제곱분포표 보는 법!  (22) 2014.10.22
카이제곱분포 개념정리!  (18) 2014.10.20
Posted by 나부랭이

댓글을 달아 주세요

  1. 통계좆밥

    와 이건 좀 어렵네여

    2015.04.12 00:52 신고 [ ADDR : EDIT/ DEL : REPLY ]
  2. ddd

    안녕하세요 블로그 잘 보고있습니다. 질문하나 드립니다.

    F분포 왼쪽 구간을 사용할때 F통계량 역수를 취하고 자유도를 바꾸는것이 왜 그러는지 이해가 잘 안됩니다.

    비대칭 분포에서 왼쪽 값을 1-a/2 로 쓰지 않고 그대로 쓰는 것과 연관이 있는지요?

    2015.04.14 16:55 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. ddd

    네 빠른 답변 감사하고 매번 잘 정리된 내용덕에 많이 알아갑니다. 앞으로도 이것저것 많이 배우고 가겠습니다.

    2015.04.14 19:48 신고 [ ADDR : EDIT/ DEL : REPLY ]
  4. qwer

    항상 잘 보고 있어요 감사합니다!

    2015.06.06 17:38 신고 [ ADDR : EDIT/ DEL : REPLY ]
  5. 질문

    덕분에 많이 알아갑니다!

    질문이 있는데요,

    혹시 R에서의 F-statistic과 여기서 설명하는 F값이 같은 것인가요?

    2015.10.04 14:20 신고 [ ADDR : EDIT/ DEL : REPLY ]
  6. f분포 그래프에서 자유도가 크면클수록 점점대칭에 가까워지고 그래프가 높게 솟는걸로 알고있습니다.


    그런데 A 6,28 /B 28,6 /C 1,40 이렇게 세개인 좌표?에 f값을 부표를 참고하여 구하면


    각 A 3,5 B 3.8 C 4.08 이렇게나오는데 그렇다면 C가 가장 정규분포에 가깝게 오른쪽에 치우치고 높게 솟아있어야 하는거 아닌가요?


    실제로 그래프를보면 가장 오른쪽에 가까운건 B이고 가장높게솟아있는건 A고 C는 왼쪽에 붙어있고


    대체 뭐가뭔지 하나도모르겠습니다.


    설명좀해주세요

    2015.10.23 07:32 신고 [ ADDR : EDIT/ DEL : REPLY ]
  7. 감탄만 나오는 포스팅입니다 !! 정말 잘만드신듯 책만들어도 될 것 같아요^^

    2015.10.25 19:54 신고 [ ADDR : EDIT/ DEL : REPLY ]
  8. 굿굿굿

    자세히 쓰셨네요
    공부 잘 하고 갑니다~

    2015.12.11 10:58 신고 [ ADDR : EDIT/ DEL : REPLY ]
  9. Erick

    통계학을 영어 책으로 만 보다가 잘 설명된 포스팅을 보니 감사할 따릅입니다.

    고맙습니다.

    2015.12.22 17:19 신고 [ ADDR : EDIT/ DEL : REPLY ]
  10. 데사스

    너무 감사합니다 !!!!!!!!!!!!!!!!!!!!!!!!

    2016.01.21 22:57 신고 [ ADDR : EDIT/ DEL : REPLY ]
  11. 비타민

    표 자세하게 올려주신 덕분에 유용하게 잘 쓰고 있어요. 감사합니다ㅎㅎ

    2016.04.22 10:23 신고 [ ADDR : EDIT/ DEL : REPLY ]
  12. 비밀댓글입니다

    2016.06.05 18:25 [ ADDR : EDIT/ DEL : REPLY ]
  13. 궁금해요

    위에 댓글 쓴 사람인데 비밀번호를 안설정해서 수정을 못하네요..
    제가 틀렸다면 알려주세요 !

    2016.06.05 18:26 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 오른쪽 F값을 구하라고 했으면, 그렇게 하는 것이 맞습니다.

      하지만 2번 문제는, "왼쪽 F값" 구하는 문제입니다.

      2016.06.09 12:10 신고 [ ADDR : EDIT/ DEL ]
  14. 통계똥멍충이

    감사합니다 ㅠㅠ

    2016.06.10 16:16 신고 [ ADDR : EDIT/ DEL : REPLY ]
  15. 통계빡통

    구글 검색통해 우연히 발견하게 되었습니다. 끄적끄적.. 와 이렇게 쉽게 풀어써 주셧구나싶다가

    F분포 설명한 페이지보고 감탄했습니다.

    현재 통계학 공부중인데 정말 많은 도움 됩니다. 감사합니다 잘 참고하겠습니다.

    2016.10.13 17:58 신고 [ ADDR : EDIT/ DEL : REPLY ]
  16. 무명씨

    안녕하세요, f-검정에 대해 검색하던 중에 본 포스팅을 발견했습니다. 유용한 정보가 많은 좋은 사이트인 것 같습니다.
    혹시 괜찮으시다면 f value의 계산 방법에 관련해서 한 가지 여쭤봐도 될까요? 굉장히 지엽적인 문제이기는 한데, 그래도 궁금한 마음이 가시지를 않아서요.. 제가 통계학적 바탕이 없다보니 근 한달 째 검색만 반복하면서 고생하고 있습니다. 혼자 해결하려고 해 봤는데, 구글링으로도 해답을 못 찾겠더라고요ㅠㅠ 일단 아래에 질문내용을 정리하겠습니다. F value를 계산하는 산술적인 문제입니다.

    제가 읽고 있는 논문에서 1번 분석기계와 2번 분석기계가 기능상 차이가 없다는 것을 보여주려고 합니다. 그래서 1일차에 1번 기계로 6번 반복실험하고, 2번 기계로 6번 반복실험을 했습니다. 그리고 2일차에 다시 1번 기계로 6번 반복실험하고.. 이것을 총 3일 동안 반복했습니다.
    그래서 각 일자마다 여러 수치를 구했습니다. 그 중 표준편차값과 f value를 보면,
    1일차 : 1번 기계가 2.26, 2번 기계가 2.33 -> f value는 (2.33^2)/(2,26^2)로 구해서 1.07입니다.
    3일차 : 1번 기계가 2.50, 2번 기계가 3.45 -> f value는 (3.45^2)/(2.50^2)로 구해서 1.90입니다.
    문제는 2일차의 data인데,
    2일차 : 1번 기계가 2.46, 2번 기계가 1.68입니다. 그런데 f value를 1.41이라고 구해 놓았더라고요. 앞선 표준편차값을 어떻게 제곱을 해서 나눠도 이 값이 안 나오는데, 혹시 제가 모르는 다른 처리방법이 있는건지 궁금합니다.
    논문에서는 기각역을 함께 기술하고 있는데 (유의수준 0.05, 자유도 둘 다 5, F = 5.05) , 값이 하나만 주어져 있었습니다.

    왜 2일차에서 f value가 1.41이 나왔는지 알 수 있을까요? ㅠㅠ 너무 답답합니다.

    2016.11.16 00:34 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 2일차만 다르게 구할 일은 없으니,

      논문에서 계산을 잘못한 거 같은데요.

      그냥 "오타"일 수도 있습니다.

      2016.11.28 15:25 신고 [ ADDR : EDIT/ DEL ]
  17. bk han

    정말 감사합니다. 덕분에 과제를 해낼수 있었습니다^^

    2016.11.25 16:10 신고 [ ADDR : EDIT/ DEL : REPLY ]
  18. cc

    학부때 슬렁슬렁 공부해서 모르고 지나갔던 개념들을 이제야 덕분에 깔끔하게 정리했네요!
    감사합니다!

    2017.07.25 19:18 신고 [ ADDR : EDIT/ DEL : REPLY ]
  19. ㅇㅇ

    표본값이 너무 커서 자유도가 표에 표기돚 않을 만큼 커지면 값을 표에서 어떻게 구해야 하나요?
    유의수준 5%로 자유도 3,141 인 f 분포를 어떻게 표에서 확인하는지 알고 싶어요

    2017.10.19 00:06 신고 [ ADDR : EDIT/ DEL : REPLY ]
  20. 집단

    세집단의 차이검증은 어떻게 하는건가요??

    2017.12.10 02:21 신고 [ ADDR : EDIT/ DEL : REPLY ]