기하평균의 의미와 수학적 감각 익히기
· 약 6분
산술평균과 기하평균의 차이를 직관적으로 이해하고, 왜 Bhattacharyya Coefficient에서 기하평균을 사용하는지 알아봅니다
1️⃣ "각 점에서 두 확률의 기하평균을 더한 값" 상세 설명
단계별 이해
이산 분포 예시:
두 확률 분포가 있다고 가정:
x₁ x₂ x₃ x₄ x₅
p: 0.3 0.2 0.1 0.2 0.2
q: 0.1 0.3 0.2 0.3 0.1
각 점에서의 계산:
x₁: √(0.3 × 0.1) = √0.03 = 0.173
x₂: √(0.2 × 0.3) = √0.06 = 0.245
x₃: √(0.1 × 0.2) = √0.02 = 0.141
x₄: √(0.2 × 0.3) = √0.06 = 0.245
x₅: √(0.2 × 0.1) = √0.02 = 0.141
합산 (BC):
BC = 0.173 + 0.245 + 0.141 + 0.245 + 0.141 = 0.945
시각적 이해:
각 점에서:
p(x) ━━━━━━━━━ (높이)
q(x) ━━━━ (높이)
기하평균 ━━━━━ (두 높이의 "균형잡힌" 중간)
↑
이걸 모든 점에서 더함
2️⃣ 산술평균 vs 기하평균: 수학적 감각
정의 비교
산술평균 (Arithmetic Mean):
기하평균 (Geometric Mean):
핵심 차이의 감각
🎯 감각 1: 곱셈적 vs 덧셈적 관계
산술평균: "더하기" 세계
→ 차이(difference)를 다룸
→ 절대적 거리
기하평균: "곱하기" 세계
→ 비율(ratio)을 다룸
→ 상대적 거리
구체적 예시:
Case 1: a=2, b=8
산술평균: (2+8)/2 = 5
기하평균: √(2×8) = √16 = 4
2 ━━━━━━━━━━━━━━━━ 8
AM=5 (중간 위치)
GM=4 (비율적 중간)
비율 관점: 2→4는 2배, 4→8도 2배 (기하평균이 비율적으로 중간!)
Case 2: a=1, b=100
산술평균: (1+100)/2 = 50.5
기하평균: √(1×100) = 10
1 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100
GM=10 AM=50.5
비율 관점: 1→10은 10배, 10→100도 10배
🎯 감각 2: 극단값에 대한 민감도
산술평균:
예시: 1, 1, 1, 1, 100
산술평균 = (1+1+1+1+100)/5 = 20.8
→ 극단값(100)에 크게 영향받음
→ "한쪽으로 끌려감"
기하평균:
예시: 1, 1, 1, 1, 100
기하평균 = ⁵√(1×1×1×1×100) = ⁵√100 = 2.51
→ 극단값에 덜 민감
→ "균형잡힌" 값
왜 이런 차이가?
- 곱셈은 0에 가까운 값이 하나라도 있으면 전체가 작아짐
- 양쪽 모두 "기여"해야 큰 값이 나옴
🎯 감각 3: 대칭성과 불변성
산술평균의 스케일 변환:
a=2, b=8 → AM=5
2배 확대: a=4, b=16 → AM=10 (2배)
✓ 선형 변환에 불변
기하평균의 비율 불변성:
a=2, b=8 → GM=4, 비율=2:8=1:4
2배 확대: a=4, b=16 → GM=8, 비율=4:16=1:4
✓ 비율 구조 보존
3️⃣ Bhattacharyya Coefficient에서 기하평균을 사용하는 이유
🔍 왜 산술평균이 아닌 기하평균인가?
만약 산술평균을 사용한다면:
문제 1: 확률의 합이 됨
p와 q가 각각 합이 1이므로
→ BC_arithmetic = (1 + 1)/2 = 1 (항상!)
→ 아무 정보도 제공 안 함 ❌
기하평균을 사용하면:
장점 1: 양쪽이 모두 높아야 큰 값
p(x) = 0.8, q(x) = 0.8 → √(0.64) = 0.8 ✓
p(x) = 0.8, q(x) = 0.1 → √(0.08) = 0.28 ✓
p(x) = 0.0, q(x) = 0.8 → √(0.00) = 0.0 ✓
→ 실제 "겹침"을 측정!
📊 시각적 비교
두 분포의 특정 점에서:
p(x) = 0.6 ━━━━━━━━━━━━
q(x) = 0.2 ━━━━
산술평균: (0.6+0.2)/2 = 0.4
→ 한쪽이 높으면 높게 평가
기하평균: √(0.6×0.2) = √0.12 = 0.346
→ 양쪽이 모두 높아야 높게 평가
→ "진짜 겹침"만 카운트
극단적 경우:
Case 1: p=1.0, q=0.0
산술평균: 0.5 (겹침이 있는 것처럼 보임)
기하평균: 0.0 (진실: 겹침 없음) ✓
Case 2: p=0.5, q=0.5
산술평균: 0.5
기하평균: 0.5 (동일)
Case 3: p=0.9, q=0.1
산술평균: 0.5 (Case 2와 같음)
기하평균: 0.3 (더 적은 겹침으로 평가) ✓
