본문으로 건너뛰기

"anti-abusing" 태그로 연결된 1개 게시물개의 게시물이 있습니다.

모든 태그 보기

Bhattacharyya Distance (바타차리야 거리) 쉽게 이해하기

· 약 6분
Nam Young Kim
Data Fullstack Engineer

두 확률 분포의 차이를 측정하는 Bhattacharyya Distance를 실생활 예시와 수식으로 완벽히 이해하기

🎯 핵심 개념

Bhattacharyya Distance는 두 개의 확률 분포가 얼마나 다른지를 측정하는 지표입니다. 쉽게 말하면, 두 그룹이 얼마나 "구별 가능한지"를 숫자로 나타낸 것이죠.

📊 실제 예시 1: 키 분포

두 그룹의 키를 비교한다고 생각해봅시다:

  • 그룹 A: 한국 성인 남성 (평균 175cm, 표준편차 6cm)
  • 그룹 B: 한국 성인 여성 (평균 162cm, 표준편차 5cm)
그룹 A:        ___
/ \
/ \___
/ \
165 175 185 (cm)

그룹 B: ___
/ \
/ \___
/ \
155 162 170 (cm)

**Bhattacharyya Coefficient (BC)**는 두 분포의 겹치는 부분(overlap)을 측정합니다:

  • BC ≈ 0.3 → 겹치는 부분이 적음 → 두 그룹이 잘 구별됨
  • Bhattacharyya Distance = -ln(0.3) ≈ 1.2