기초통계학

'유의하다' 는 말의 통계적 의미?

datasummary 2025. 8. 14. 13:58

우리가 논문이나 통계학 책을 읽다 보면, '통계적으로 유의하다'는 표현을 자주 만나게 됩니다. 

얼핏 보면 '의미가 있다', '중요하다' 는 듯한 뉘앙스를 풍기지만, 사실은 조금 다른 의미일 수 있습니다.

오늘은 이 '유의하다'는 말의 의미를 파헤치고자 합니다.

 

1. 유의확률(p-value)이란?

유의확률은 영어로 p-value라고 부릅니다. 정의는 다음과 같습니다.

귀무가설이 참이라고 가정했을 때, 지금 관찰한 결과(혹은 그보다 더 극단적인 결과)가 나타날 확률

쉽게 말하면, “귀무가설이 맞는데도 이렇게 이상한 데이터가 나올 확률이 얼마나 될까?”를 알려주는 수치입니다.

통계학자들은 이상한 데이터가 나올 확률의 최대값을 정하고, 이를 넘지 않는 선 안에서 통계적 의미를 파악합니다.

 

유의확률 p ~= 0.02, 유의수준 alpha = 0.05인 정규분포이다.

 


2. “유의하다”의 정확한 뜻

통계에서는 보통 유의수준을 5% ()로 정합니다.

  • 만약 p-value가 0.05보다 작다면 → “귀무가설을 기각한다”, 즉 “통계적으로 유의하다”라고 말합니다.
  • 여기서 중요한 점은, 귀무가설이 틀렸다는 사실을 보장하는 것이 아니라, 귀무가설이 맞다면 이런 데이터가 나오기 힘들다는 의미라는 겁니다.

3. 흔한 오해들

  • “p=0.03이니까 귀무가설이 틀렸을 확률은 97%다.”
    → 잘못된 해석입니다. p-value는 귀무가설이 틀렸을 확률을 말하지 않습니다.
  • “p=0.07이면 효과가 전혀 없다.”
    → 이것도 잘못된 해석입니다. 단지 통계적으로 충분히 강한 증거가 없다는 뜻일 뿐입니다.

 

  • p=0.07의 올바른 해석  => “귀무가설이 맞다면, 이런 데이터가 나올 확률은 7% 정도다.”

4. ‘유의하다’와 ‘의미 있다’는 다르다

여기서 더 중요한 구분이 있습니다.

  • “유의하다” = 통계적으로 귀무가설 하에서 드문 결과다
  • “의미 있다” = 실제로 현상이나 효과가 크고, 해석상 중요하다

예를 들어, 아주 큰 표본을 모으면 실제로는 미세한 차이도 유의하게 나올 수 있습니다. 하지만 그 차이가 현실적으로는 중요하지 않을 수 있습니다. 반대로 표본이 적으면 큰 효과가 있어도 유의하지 않게 나올 수 있습니다.


5. 예시: 동전을 던졌을 때

정상적인 동전이라면 앞면이 나올 확률은 50%입니다. 그런데 동전을 10번 던졌는데 9번이나 앞면이 나왔다고 해봅시다.

  • 귀무가설 H0H_0: 동전은 공정하다 (앞·뒷면 확률이 0.5다).
  • 실제 관찰된 데이터: 10번 중 9번 앞면.

이 경우, “공정한 동전인데도 9번 이상 앞면이 나올 확률”을 계산하면 약 1% 정도밖에 되지 않습니다.
즉, p-value ≈ 0.01이 됩니다.

  • p-value(0.01) < 유의수준(0.05)이므로 → 귀무가설을 기각하고, “통계적으로 유의하다”라고 말합니다.

하지만 이 결과가 곧바로 “동전이 조작됐다”라는 뜻은 아닙니다. 다만 공정한 동전이라고 가정하면 이렇게 극단적인 결과가 나올 가능성은 매우 낮다는 것을 보여주는 것이죠.

 

앞면이 나온 횟수가 5에서 멀어질수록, 확률이 급감하는 모습이다.


6. 정리

따라서 통계에서 “유의하다”는 말을 만났을 때는 이렇게 이해하면 됩니다.

  • “유의하다” = 귀무가설이 맞다면, 이런 데이터가 나올 확률이 매우 낮다.
  • 하지만 그 효과가 실제로 ‘의미 있는가?’는 별도의 해석 문제입니다.

즉, 통계적 유의성과 실질적 중요성은 항상 구분해서 생각해야 합니다.

 

통계학을 공부하시는 분들께 도움이 되길 바랍니다:)