최근접 이웃 그래프 기반 점수 함수로 구현하는 최적 이상 탐지

본 논문은 고차원 명목 데이터에 대해 최근접 이웃 그래프에서 정의한 점수 함수를 이용해 비모수적 이상 탐지 알고리즘을 제안한다. 테스트 샘플의 점수가 사전 지정된 허위 경보 수준 α 보다 낮으면 이상으로 판정한다. 제안 방법은 이상 밀도가 명목 밀도와 알려진 밀도의 혼합 형태일 때, 지정된 α 에 대해 균일하게 가장 강력한 검정임을 이론적으로 증명한다. 계산 복잡도는 차원에 선형, 데이터 크기에 이차적으로 증가하며, 복잡한 파라미터 튜닝 없이 …

저자: Manqi Zhao, Venkatesh Saligrama

본 논문은 고차원 명목 데이터 집합에 대해 비모수적이며 적응적인 이상 탐지 알고리즘을 설계하고, 그 이론적 최적성과 실험적 효율성을 동시에 입증한다. 연구 동기는 기존의 고차원 이상 탐지 기법이 커널 밀도 추정, 파라미터 튜닝, 차원의 저주 등으로 인해 실용성이 떨어지는 점에 있다. 이를 해결하기 위해 저자들은 n개의 명목 샘플을 이용해 최근접 이웃 그래프(Nearest Neighbor Graph, NNG)를 구성하고, 각 정점에 점수 함수(score function)를 정의한다. 점수는 해당 정점이 주변 이웃과 얼마나 가깝게 위치하는지를 정량화한 값으로, 구체적으로는 k‑nearest neighbor 거리의 역수 혹은 거리 누적 분포 형태로 구현된다. 이러한 점수는 데이터의 국부적 밀도 추정과 동일시될 수 있어, 고차원에서도 효율적인 밀도 기반 판단을 가능하게 한다. 알고리즘 절차는 크게 세 단계로 나뉜다. 첫 번째 단계에서는 명목 데이터 전체에 대해 NNG를 구축한다. 이 과정은 모든 쌍의 거리 계산을 필요로 하므로 시간 복잡도는 O(n² d)이며, 차원 d에 대해서는 선형 확장이 된다. 두 번째 단계에서는 각 정점에 대해 점수를 계산하고, 이를 정규화하여

최근접 이웃 그래프 기반 점수 함수로 구현하는 최적 이상 탐지

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기