나는 문어~ 꿈을 꾸는 문어~
t-test (t-검정)을 이해해보자 본문
나는 통계를 공부하는 중이다. 실무에서는 사용해본 적이 없고 사용해보고 싶다. 틀린 내용이 있으면 댓글로 알려주길 바라지만 아직 내 블로그에는 검색을 통한 방문자가 없다. ㅠㅠ
오로지 나의 관점으로 t-test를 이해해보겠다.
t-test란?
t-test는 모집단이 정규분포를 따를 때, 모평균을 검정하는 방법 중 하나다. 검정을 공부하다보니 대부분 비슷한 과정을 거친다는 것을 알 수 있었다. t-test만의 특성은 다음과 같다.
- 모분산을 모를 때 모평균을 검정한다. 우리는 보통 모분산을 모르는 경우가 많으므로 t-test를 많이 사용하게 된다.
- t-분포를 사용한다.
- 표본의 개수가 30 이하다. 표본의 개수가 n=30 이상으로 많다면 표본 분산은 모분산에 근사하고 중심극한정리에 의해 표본 평균의 분포는 정규 분포에 근사하므로 t-분포를 사용하지 않아도 된다.
t-test의 과정
t-test 과정은 다음과 같다.
- 귀무가설과 대립가설을 세운다.
- t-검정통계량과 확률 분포인 t-분포를 설정한다.
- 유의 수준 α와 기각역을 정한다.
- 표본으로부터 t-value를 구하고 기각역에 포함되는지 포함되지 않는지를 본다. t-value를 통해 p-value를 구하고 α와 비교하는 것과 같은 절차다.
- t-value가 기각역에 포함된다면 귀무가설을 기각하고 대립가설을 채택한다.
예시
토익 학원에 다니려고 한다고 해보자. 토익 학원에서는 이 학원 과정을 수료하면 평균 800점을 맞을 수 있다고 광고를 한다. 그런데 아무리 생각해봐도 저 과정을 수료했다고 800점이 나온다니 믿을 수 없다. 분명히 800점보다 낮은 것 같다. 이 의심을 해소하기 위해 통계적으로 검정을 해보려고 한다.
학원 과정을 수료한 10명에게 직접 물어봐서 점수를 알아냈고 다음과 같다.
700, 810, 770, 800, 720, 720, 760, 830, 820, 770
표본 평균은 770이다.
실제로 모평균이 800이더라도 표본을 뽑아 평균을 구하면 정확히 800이 나오는 경우는 드물것이다. 전수조사를 하지 않는한 그럴 것이다. 하지만 모평균이 800인 상황에서 표본평균이 500이나올 수 있을까? 600이 나올 수 있을까? 아주 기적적으로 그런 사람들만 뽑았다면 그럴 수 있겠지만 그럴 확률은 제로에 가까울 것이다. 이런 상황에서 우리는 "그래, 역시 평균은 800점보다 낮아"라고 할 수 있는 것이고 귀무가설을 기각하고 대립가설을 채택한다.
만약 표본평균이 798점이 나왔다면 모평균이 800보다 작다고 자신있게 말할 수 있을까? 그렇지 않다. 2점 차이 정도는 우리가 충분히 허용할 수 있는 오차이기 때문이다. 이럴 때는 귀무가설을 기각할 수 없다고 결론내린다.
그렇다면 이를 판단하는 기준은 무엇일까? 유의수준 α다. 정하기 나름이지만 일반적인 수치와 같이 나도 α=0.05를 사용하겠다. 모평균이 800이라고 했을 때 우리가 측정한 표본평균 770점이 나올 확률이 0.05(5%)보다 적다면 모평균이 800이 아닐 것이라고 판단할 수 있는 것이다.
1. 귀무가설과 대립가설을 세운다.
귀무가설은 내가 의심하는 것, 검증하고 싶어하는 것이 아무것도 아닐 것이라고 하는 가설이다. 예를 들어 어떤 신약에 대해 약효가 있는지 알고 싶다면 귀무가설은 "약효가 없다"이다. 두 집단의 몸무게에 차이가 있는지를 알고 싶다면 귀무가설은 "두 집단의 몸무게 차이는 없다"이다.
대립가설은 귀무가설에 대립되는 가설이다. 첫 번째 예에서 대립가설은 "약효가 있다"이고, 두 번째 예에서는 "몸무게 차이가 있다"이다. 검정 과정을 수행한 후 귀무가설이 말이 안된다고 주장할 수 있다면 귀무가설을 기각하고 우리가 주장하고 싶은 바인 대립가설을 채택할 수 있는 것이다.
똑같이, 나는 여기서 해당 학원 수료생의 평균 점수가 800점보다 낮은 지를 알고싶다. 따라서 귀무가설과 대립가설은 다음과 같다.
- 귀무가설 H0 : 학원 수료생의 평균 점수는 800점이다.
- 대립가설 H1 : 학원 수료생의 평균 점수는 800점보다 낮다.
사실 귀무가설을 세우고 대립가설이 세울 때 의문이 들 수 있다. 800점인 것이 귀무가설이면 800점이 아닌게 대립가설이어야하는데, 그러면 800점보다 높거나 낮은 것을 대립가설로 해야하는게 아닌가 싶다.
높거나 낮은 것을 대립가설로 놓는다면 이를 양측 검정이라고 하고, 높은 것 혹은 낮은 것 한 쪽만 대립가설로 놓는다면 이를 단측 검정이라고 한다.
이는 통계적으로 검정하고 싶은 대상이 무엇이냐에 따라 정하는데, 나의 예시의 경우 800점보다 높은데 800점이라고 구라쳤다는 생각은 할 일이 없으므로 단측 검정을 선택했다.
2. t-검정통계량과 확률 분포인 t-분포를 설정한다.
모분산을 모르고 표본의 개수가 적은 현재 상황에서 아래 식과 같은 검정통계량 t를 사용한다.
그리고 이는 t(n-1) 분포를 따른다. 이는 표본의 개수에 따라 변하는 자유도에 의존하는 분포이다. 우리의 표본은 10개이므로 자유도가 9인 t분포를 따르게 된다.
t의 형태는 표준정규분포인 z-분포와 매우 유사하다. 모표준편차 σ를 모르기 때문에 그 대신 우리가 알고 있는 표본표준편차 s를 대입한 형태다.
우리는 귀무가설에 따라 모평균이 800이라고 가정을 한 상태이므로 μ는 800이다. 표본표준편차를 구하기 위해 우리의 표본을 다시 소환해보자.
700, 810, 770, 800, 720, 720, 760, 830, 820, 770
표본표준편차를 구해보자.
위 공식에 따라 표본분산은 2066이고 여기에 루트를 씌운 표본표준편차 s는 45.5다.
3. 유의 수준 α와 기각역을 정한다.
유의 수준은 위에서 언급했듯 0.05로 정했다. 그에 따라 기각역은 다음과 같이 정해진다.
위 그래프에서 진한 회색의 영역이 기각역이다. 지금은 토익점수의 모평균이 특정 값보다 작은지 확인하는 것이기 때문에 왼쪽단측검정의 그래프를 들고 왔다. 유의수준 α를 0.05로 정했다는 것은 기각역의 크기가 0.05라는 것이다.
4. 표본으로부터 t-value를 구하고 기각역에 포함되는지 포함되지 않는지를 본다.
나의 경우 통계를 공부하는 과정에서 처음에 t-value가 헷갈렸다. 일단 용어가 너무 많다. 유의수준 α, t-value, p-value, 기각역 등등... t-value가 뭐냐면, value는 한국말로 값이라는 뜻이므로 t-value는 t 값이다.
위에서 다시 t식을 가져와보자.
t를 결정하는 식에서 표본평균의 값을 제외한 μ, s, n은 상수다. 따라서 표본평균에 따라 t는 달라지게 되고 t를 x축으로 하여 그린 확률밀도함수가 위의 t분포 그래프다.
표본평균이 우리가 가정한 800과 같을 때의 t 값(t-value)은 0이 된다. 그렇다면 우리의 표본에 대한 t 값을 정할 수 있고, t 값이 어느 위치에 있냐에 따라 우리의 판단은 달라진다.
내가 구한 표본의 평균이 798점이라면 t 값은 0과 얼마 차이나지 않게 계산이 될 것이다. 이는 798점이 모평균이 800일 때 충분히 나올만한 수치라는 뜻이므로 모평균은 800점이라고 통계적으로 판단할 수 있게 되는 것이다. 기존의 값을 수용하면 되므로 통계적으로 의미가 없다.
하지만 우리가 뽑은 표본의 평균이 그보다 작아서 계산된 t 값이 기각역으로 들어가게 된다면, 이는 우리가 뽑은 표본은 굉장히 우연히 뽑힌 것이라고 생각할 수 있다. 구체적으로 이야기하자면 모평균이 800일 때, 5%(유의수준 α=0.05)도 안되는 확률로 뽑힐만한 표본이 뽑혀버린 것이다. 그렇다면 두 가지 중 하나로 생각할 수 있다.
- 정말 우연히 저런 표본이 뽑혔다.
- 모평균은 800점이 아니다.
유의수준 α를 0.05로 설정했다는 것은 t 값이 α=0.05에 대한 기각역으로 들어오면 모평균이 800이 아니라고 간주하겠다는 것, 즉 귀무가설을 기각하겠다는 뜻이다. 이는 기존의 값을 반박할 수 있으므로 통계적으로 의미가 있다고 할 수 있고, 그래서 α를 유의(의미가 있는)수준이라고 하는 것이다.
그렇다면 드디어 표본에 대한 t 값을 구해보자. 표본평균은 770이고 나머지 값들도 구해놨으므로 t 값을 바로 계산할 수 있다. 식을 통해 계산해보면 t 값은 -2.09가 나온다. 이 값이 기각역에 포함되는지 여부를 아래 t 분포표를 통해 알아보자
우리가 사용할 부분은 동그라미를 친 1.833이라는 값이다. 1열은 자유도를 나타내므로 우리 표본의 자유도 9를 찾고, 맨 위 행에서 일방향(단측)검정 부분에서 앞서 정한 유의수준 0.05를 찾아 값을 보니 1.833이다. 이는 자유도가 9인 t 분포에서 t 값이 1.833보다 큰 영역의 넓이가 0.05라는 것인데, t 분포는 좌우대칭이고 현재 왼쪽단측검정을 사용해야하므로 t 값이 -1.833보다 작은 영역의 넓이가 0.05이고 이 부분이 기각역인 것을 알 수 있다.
우리의 t 값은 기각역이 시작하는 -1.833보다 왼쪽에 있으므로 기각역에 포함된다고 볼 수 있다.
5. t-value가 기각역에 포함된다면 귀무가설을 기각하고 대립가설을 채택한다.
t 값이 기각역에 포함되므로, 이는 모평균이 800이라고 가정할 경우 우리의 표본이 뽑혔을 확률이 매우 낮다고 볼 수 있다. 따라서 귀무가설을 기각하고 대립가설을 채택한다.