![다양한 거리개념 | 하우스도르프 거리, 프로크루스테스 거리, 마할라노비스 거리](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FlGHT6%2FbtsARgFLeAi%2FHvRkDpF1TCne9b713i1Gfk%2Fimg.png)
하우스도르프 거리(Hausdorff Distance)
하우스도르프 거리는 두 집합 간의 최대 거리를 측정합니다. 이는 주로 이미지 처리, 컴퓨터 비전에서 두 형태나 이미지 간의 유사성을 측정하는 데 사용됩니다. 두 집합 $A$와 $B$의 하우스도르프 거리는 다음과 같이 정의됩니다.
$$
d_H(A, B) = \max\left\{\sup_{a \in A} \inf_{b \in B} d(a, b), \sup_{b \in B} \inf_{a \in A} d(b, a)\right\}
$$
이 거리는 집합 $A$의 각 점과 집합 $B$의 가장 가까운 점 사이의 거리 중 최대값과, 집합 $B$의 각 점과 집합 $A$의 가장 가까운 점 사이의 거리 중 최대값을 비교하여 더 큰 값을 취합니다.
프로크루스테스 거리(Procrustes Distance)
프로크루스테스 거리는 두 데이터 집합의 형태와 크기를 비교할 때 사용되며, 데이터를 최적으로 맞추기 위한 변환(이동, 회전, 크기 조정) 후의 거리를 측정합니다. 이는 주로 형태학적 분석이나 기타 통계적 형태 비교에 사용됩니다.
마할라노비스 거리(Mahalanobis Distance)
마할라노비스 거리는 데이터가 평균으로부터 얼마나 멀리 떨어져 있는지를 측정하는 방법입니다. 이는 변수들이 상관 관계를 가지고 있을 때 특히 유용합니다. 데이터 포인트 $x$와 평균 $\mu$, 공분산 행렬 $S$에 대해 마할라노비스 거리는 다음과 같이 정의됩니다.
$$
d_M(x, \mu) = \sqrt{(x - \mu)^T S^{-1} (x - \mu)}
$$
이 거리는 다변량 데이터에서 이상치를 탐지하는 데 자주 사용됩니다.
각각의 거리 측정 방법에 따라 원점으로부터 거리가 1인 점들의 집합, 즉 '원'이 어떤 모양을 갖는지 설명하겠습니다. 이를 시각적으로 이해하기 위해, 각 거리 측정 방법에 따른 원의 모양을 그려보겠습니다.
- 하우스도르프 거리(Hausdorff Distance) 에서의 원:
- 하우스도르프 거리는 두 집합 간의 최대 거리를 측정합니다. 이 경우, 원은 원점에서 가장 먼 점을 포함하는 경계를 갖습니다. 그러나 하우스도르프 거리로 정의된 원의 모양은 표준적이지 않으며, 특정 집합의 형태에 크게 의존합니다.
- 프로크루스테스 거리(Procrustes Distance) 에서의 원:
- 프로크루스테스 거리는 두 데이터 집합 간의 최적의 매칭을 찾는 과정에서 나오는 거리입니다. 원은 이러한 매칭 과정에서 원점으로부터 동일한 거리에 있는 점들의 집합을 나타냅니다. 그러나 이 경우에도 원의 모양은 데이터 집합의 특성에 따라 다를 수 있습니다.
- 마할라노비스 거리(Mahalanobis Distance) 에서의 원:
- 마할라노비스 거리에서 원점으로부터 거리가 1인 원은 일반적으로 타원 형태를 띕니다. 이 거리는 데이터의 분산과 상관 관계를 고려하므로, 원의 모양은 공분산 행렬의 특성에 따라 달라집니다.
하우스도르프 거리와 프로크루스테스 거리의 경우, '원'의 표준적인 모양을 정의하기 어렵습니다. 이는 이러한 거리 측정 방법들이 일반적인 기하학적 형태보다는 데이터 집합 간의 관계나 매칭을 분석하는 데 중점을 두기 때문입니다. 반면, 마할라노비스 거리에서의 원은 타원 형태를 띄는 것이 일반적입니다.
이러한 특성을 고려하여 마할라노비스 거리에서의 원점으로부터 거리가 1인 점들의 집합을 그려보겠습니다. 다만, 하우스도르프 거리와 프로크루스테스 거리로 정의된 원의 모양은 구체적인 데이터 집합이나 맥락에 따라 달라질 수 있으므로, 이를 표준적인 형태로 그리는 것은 불가능합니다.
위 그래프는 마할라노비스 거리를 사용하여 원점으로부터 거리가 1인 점들의 집합을 나타냅니다. 이 경우, 그 형태는 타원으로 나타나며, 이는 공분산 행렬의 특성에 따라 변형된 모습입니다. 원점 주변의 이 타원은 마할라노비스 거리가 1인 모든 점들을 포함합니다.
하우스도르프 거리와 프로크루스테스 거리로 정의된 '원'의 모양은 특정 상황과 데이터 집합에 따라 달라지므로, 일반적인 형태로 표현하는 것은 어렵습니다. 이러한 거리 측정 방법들은 보다 복잡하고 상황에 따라 변하는 데이터 구조를 다루는 데 적합합니다.
위 그래프는 마할라노비스 거리를 사용하여 원점으로부터 거리가 1인 점들의 집합을 나타냅니다. 이 경우, 그 형태는 타원으로 나타나며, 이는 공분산 행렬의 특성에 따라 변형된 모습입니다. 원점 주변의 이 타원은 마할라노비스 거리가 1인 모든 점들을 포함합니다.
하우스도르프 거리와 프로크루스테스 거리로 정의된 '원'의 모양은 특정 상황과 데이터 집합에 따라 달라지므로, 일반적인 형태로 표현하는 것은 어렵습니다. 이러한 거리 측정 방법들은 보다 복잡하고 상황에 따라 변하는 데이터 구조를 다루는 데 적합합니다.
You know what's cooler than magic? Math.
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!