게임 이론 기반 다목적 클러스터링 전략 선택 방법
초록
본 논문은 대규모 데이터셋에서 게임 이론을 활용한 다목적 클러스터링의 연산 복잡도를 낮추기 위해 각 플레이어의 전략 집합을 선택적으로 축소하는 방법을 제안한다. 전략 선택을 통해 페이오프 행렬의 차원을 크게 감소시켜 시간 복잡도를 크게 개선하고, 실험을 통해 제안 기법이 기존 방법 대비 계산량을 현저히 줄이면서도 클러스터링 품질을 유지함을 입증하였다.
상세 분석
이 연구는 게임 이론을 다목적 클러스터링에 적용할 때 가장 큰 병목으로 작용하는 ‘전략 공간의 폭발적 증가’와 ‘페이오프 행렬의 차원 확대’를 근본적으로 해결하고자 한다. 기존의 게임 기반 클러스터링 알고리즘은 각 데이터 포인트를 하나의 플레이어로 모델링하고, 가능한 클러스터 할당을 전략으로 간주한다. 데이터 수가 늘어날수록 각 플레이어가 가질 수 있는 전략 수가 기하급수적으로 증가하고, 이에 따라 전체 페이오프 행렬의 크기도 급격히 커진다. 이는 메모리 사용량과 계산 시간 모두를 비현실적인 수준으로 끌어올린다.
논문에서 제안한 핵심 아이디어는 “전략 선택(Strategy Selection)”이다. 구체적으로, 전체 데이터셋을 여러 개의 로컬 게임으로 분할하고, 각 로컬 게임 내에서 클러스터를 서브클러스터로 세분화한다. 그런 다음 각 플레이어가 실제로 고려해야 할 전략을 전체 전략 집합이 아닌, 해당 로컬 게임에서 의미 있는 서브클러스터 할당 후보군으로 제한한다. 이 과정은 두 단계로 이루어진다. 첫 번째 단계는 데이터의 전반적인 구조를 파악하기 위한 사전 클러스터링(예: k‑means)으로 초기 클러스터 중심을 설정하고, 이를 기반으로 로컬 게임 영역을 정의한다. 두 번째 단계에서는 각 로컬 영역 내에서 플레이어가 선택할 수 있는 전략을 ‘대표 서브클러스터’ 몇 개로 압축한다. 이렇게 하면 각 플레이어당 전략 수가 O(1) 수준으로 유지되며, 전체 페이오프 행렬은 플레이어 수와 전략 수의 곱에 비례하는 크기로 크게 축소된다.
전략 선택 과정에서 손실되는 정보는 최소화하기 위해 두 가지 보완 메커니즘을 도입한다. 첫째, 서브클러스터 후보를 선정할 때 거리 기반 유사도와 클러스터 내 분산을 동시에 고려하여, 정보 손실이 큰 전략은 제외하고 핵심 전략만 남긴다. 둘째, 선택된 전략 집합에 대해 반복적인 베스트‑리스폰스 다이나믹스를 적용해 Nash Equilibrium에 근접하도록 한다. 이때, 전략 집합이 제한되어 있기 때문에 각 반복 단계의 계산량이 크게 감소한다.
복잡도 분석 결과, 기존 전체 전략 공간을 사용한 경우 시간 복잡도가 O(N·K·S) (N: 데이터 수, K: 클러스터 수, S: 각 플레이어당 전략 수) 로 급격히 증가했지만, 제안 방법은 로컬 게임당 전략 수를 상수 c 로 고정함으로써 O(N·K·c) 로 선형에 가깝게 만든다. 메모리 측면에서도 페이오프 행렬을 희소 행렬 형태로 저장하고, 로컬 게임 별로 독립적으로 계산함으로써 메모리 사용량을 O(N·c) 로 억제한다.
실험에서는 합성 데이터와 실제 대규모 데이터셋(예: 이미지 피처, 텍스트 임베딩)을 대상으로 기존 게임 기반 다목적 클러스터링 알고리즘과 비교하였다. 결과는 평균 실행 시간이 70 % 이상 감소했으며, 클러스터링 품질을 평가하는 다목적 지표(예: Davies‑Bouldin Index, Silhouette Score, 다목적 파라미터 조합)에서도 차이가 미미하거나 오히려 소폭 개선되는 현상을 보였다. 이는 전략 선택이 단순히 연산량을 줄이는 것이 아니라, 불필요한 전략을 배제함으로써 탐색 공간을 정제하고, 더 안정적인 균형 해를 찾는 데 기여한다는 점을 시사한다.
한계점으로는 로컬 게임 구성을 위한 초기 클러스터링 단계가 전체 성능에 영향을 미칠 수 있다는 점과, 전략 선택 기준에 따라 정보 손실이 발생할 가능성이 있다는 점을 들 수 있다. 향후 연구에서는 적응형 로컬 게임 설계와 동적 전략 선택 메커니즘을 도입해 이러한 문제를 보완하고, 비선형 목표 함수나 제약 조건이 복잡한 실제 응용 분야에 적용할 수 있는 확장성을 탐색할 예정이다.