자기조직화지도 거미줄 시각화 모델
초록
본 논문은 기존 SOM의 격자형 시각화 한계를 극복하고, 변수 간 상호작용 강도를 거미줄 형태의 실선으로 재구성하는 새로운 시각화 기법을 제안한다. 이 기법은 빅데이터와 같이 차원이 높은 비정형 데이터를 직관적으로 파악할 수 있게 하며, 시나리오 간 비교 분석을 용이하게 만든다.
상세 분석
본 연구는 Self‑Organizing Map(SOM)의 전통적인 2차원 격자 표현이 데이터 간의 연관성을 한눈에 파악하기 어렵다는 문제점을 지적한다. 특히 고차원 비정형 데이터에서 변수들 사이의 상관관계와 강도를 시각적으로 전달하는 데 한계가 있다. 이를 해결하기 위해 저자는 SOM의 위상 구조를 유지하면서 각 노드(변수)를 방사형으로 배치하고, 변수 간 거리와 가중치를 ‘실’(thread)로 표현하는 거미줄(Spider) 그래프를 설계하였다.
핵심 기술은 다음과 같다. 첫째, SOM 학습 후 각 노드의 프로토타입 벡터를 고유 좌표계에 매핑한다. 둘째, 변수 간 코사인 유사도 혹은 상관계수를 기반으로 연결 강도를 계산하고, 이 값을 실의 두께와 색상으로 변환한다. 셋째, 실의 길이는 변수 간 거리(유사도 역수)를 반영하도록 조정하여, 강한 연관성을 가진 변수는 짧고 굵은 실로, 약한 연관성은 길고 얇은 실로 표현한다. 넷째, 다중 시나리오(예: 시간 흐름, 조건 변화) 분석을 위해 동일한 변수 집합에 대해 여러 거미줄을 겹쳐 그리며, 투명도와 색상 차별화로 비교가 가능하도록 했다.
이러한 설계는 기존 레이더 차트가 축마다 동일한 스케일을 강제하고, 실의 두께와 색상 변화를 지원하지 못하는 점을 보완한다. 또한, 시각적 복잡성을 최소화하기 위해 자동 레이아웃 알고리즘을 적용해 실이 겹치는 현상을 최소화하고, 인터랙티브 줌·패닝 기능을 제공한다. 실험에서는 10,000건 이상의 로그 데이터와 150차원 유전형 데이터에 적용했으며, 전문가 평가에서 변수 간 상관관계 파악 속도가 평균 35% 향상된 것으로 보고되었다.
한계점으로는 차원이 매우 많을 경우 실의 수가 기하급수적으로 증가해 그래픽 부하가 커질 수 있다는 점이며, 이를 해결하기 위해 임계값 기반 필터링과 클러스터 기반 축소 기법을 제안한다. 또한, 색맹 사용자에 대한 접근성을 고려해 색상 외에도 패턴(점선, 대시)으로 강도를 구분하도록 설계할 수 있다.
전반적으로 이 논문은 SOM 기반 차원 축소와 거미줄 시각화의 결합을 통해 빅데이터 분석가가 복잡한 변수 네트워크를 직관적으로 탐색하고, 시나리오 간 변화를 한눈에 비교할 수 있는 실용적인 도구를 제공한다는 점에서 의의가 크다.