“평균 연봉이 5천만 원이라는데, 왜 나는 그런 사람을 본 적이 없지?”
통계학에서 가장 자주 듣는 말, ‘평균’.
누구나 한 번쯤은 평균이라는 말을 들어봤고, 막연히 중간 정도?라고 생각할지도 모릅니다.
하지만 알고 보면 평균은 단순한 계산 결과가 아닙니다.
그리고 평균만 보면 ‘잘못된 결론’을 내릴 수도 있어요.
그래서 오늘은 평균이 말해주는 것과, 말해주지 못하는 것, 그리고 그걸 보완해주는 ‘분산’에 대해 이야기해보려 합니다.
1. 평균은 왜 중심일까?
평균이란,
여러 수를 더해서 개수로 나눈 값입니다.
예를 들어, 어떤 반의 시험 점수가 70, 80, 90점이라면,
평균은 (70 + 80 + 90) ÷ 3 = 80점이죠.
이 숫자는 마치 모든 사람이 80점을 받은 것처럼 보이게 합니다.
그래서 평균은 흔히 '대표값'으로 사용돼요.
하지만 여기서 잠깐 생각해볼게요.
아래 두 반의 점수를 봐주세요.
- A반: 70, 80, 90
- B반: 10, 80, 150
두 반의 평균은 모두 80점입니다.
그런데 느낌은 확 다르지 않나요?
그럼, 이런 차이를 어떻게 설명할 수 있을까요?
2. 흩어짐을 말해주는 ‘분산’
위 두 반의 가장 큰 차이는 바로 점수의 ‘흩어짐’입니다.
A반은 점수들이 평균인 80점 근처에 모여 있는 반면,
B반은 누군가는 아주 못 보고, 누군가는 엄청 잘 본 상태죠.
이런 흩어짐 정도를 숫자로 표현한 것이 바로 ‘분산’입니다.
▪️ 분산이란?
각 점수가 평균에서 얼마나 떨어져 있는지를 모두 제곱해서 평균낸 값
예를 들어 A반의 평균은 80점이니,
각 점수와 평균의 차이를 계산해 보면:
- (70 - 80) = -10 → 제곱하면 100
- (80 - 80) = 0 → 제곱하면 0
- (90 - 80) = 10 → 제곱하면 100
이걸 평균내면
(100 + 0 + 100) ÷ 3 = 66.7 (분산)
B반은? 차이가 훨씬 크겠죠.

3. 그런데 왜 굳이 ‘제곱’해?
많은 분들이 처음에 의문을 가집니다.
“그냥 차이의 평균을 내면 되는 거 아닌가요?”
그럴듯하지만, 실제로 해보면 이상한 일이 벌어져요.
‘편차’(차이)만 더하면 전부 0이 되어버리거든요!
그래서 통계학자들은 이렇게 생각했어요:
“음수와 양수의 차이를 없애고, 멀리 떨어진 값은 더 크게 반영하자!”
그래서 제곱을 사용하는 겁니다.
그리고 분산의 단위를 다시 원래대로 돌리기 위해, 제곱근을 씌운 것을
우리는 ‘표준편차’라고 부릅니다.
4. 평균과 분산은 짝꿍이다
평균이 전체 데이터를 대표하는 중심이라면,
분산은 그 데이터가 얼마나 흩어져 있는지 알려주는 지표입니다.
이 두 숫자를 함께 봐야, 아래 질문에 답변할 수 있어요.
“우리 반은 평균만큼 잘 본 건가요, 아니면 한두 명이 평균을 끌어올린 건가요?”
평균과 분산에 대해 이해하기 쉽게 간단하게 설명해 보았습니다.
통계학을 공부하시는 분들께 도움이 되시길 바랍니다:)
'기초통계학' 카테고리의 다른 글
| 평균과 중앙값, 둘이 다른거야? (0) | 2025.08.13 |
|---|---|
| 표준편차? 표준오차? 변동계수? 용어 정리해드립니다. (0) | 2025.08.11 |
| 표본은 왜 뽑을까? (0) | 2025.08.06 |
| 95% 에서 99%로 바꾸면 어떤 일이 생길까? (0) | 2025.08.05 |
| 신뢰구간은 '정답이 포함될 확률?'일까? (0) | 2025.08.04 |