기초통계학

가설검정(Hypothesis Testing) 이해하기

datasummary 2025. 8. 22. 20:33

가설검정이란?

가설검정은 말 그대로 가설을 세우고, 데이터를 통해 검증하는 절차입니다.
이때 두 가지 가설을 세우는 것이 기본입니다.

  • 귀무가설(H0): 기존에 참이라고 가정하는 가설
  • 대립가설(H1): 새롭게 주장하거나 검증하고 싶은 가설

예를 들어, 동전이 공정한지 확인하고 싶다면

  • 귀무가설: 동전은 공정하다 (앞면 나올 확률 = 0.5)
  • 대립가설: 동전은 공정하지 않다 (앞면 나올 확률 ≠ 0.5)

이렇게 설정하게 됩니다.


가설검정 절차

  1. 가설 설정
    H0, H1을 명확히 세운다.
  2. 유의수준(α) 설정
    얼마나 엄격하게 판단할지를 정한다. 보통 0.05(5%)를 사용한다.
  3. 검정통계량 계산
    표본에서 얻은 데이터를 요약한 수치로, 가설이 맞는지 판단에 사용한다.
  4. p-value 확인
    관측된 데이터가 귀무가설 하에서 나타날 확률이다.
    • p-value < α → 귀무가설 기각
    • p-value ≥ α → 귀무가설 채택(혹은 기각하지 못함)

예시: 동전 던지기

정상적인 동전이라면 앞면이 나올 확률은 0.5입니다. 그런데 동전을 10번 던졌더니 9번이 앞면이 나왔다고 해봅시다.

  • 귀무가설 H0: 동전은 공정하다 (앞·뒷면 확률이 0.5다).
  • 실제 데이터: 10번 중 9번 앞면.

만약 정말로 공정한 동전이라면 "10번 던져서 9번 이상 앞면이 나올 확률"은 약 1% 정도밖에 되지 않습니다.
즉, p-value ≈ 0.01이 됩니다.

만약 우리가 유의수준을 0.05로 정했다면, p-value(0.01) < 0.05 이므로 귀무가설을 기각합니다.
즉, 통계적으로는 "이 동전이 공정하다고 보기 어렵다"라고 판단할 수 있습니다.