시각화 해석성 학습: 적응형 Cox 모델과 사용자 실험을 통한 품질 측정 결합

**1. 연구 배경 및 목적** 시각화는 고차원 데이터를 2차원 평면에 투영함으로써 인간이 데이터를 직관적으로 이해하도록 돕는다. 그러나 시각화가 실제로 얼마나 “해석 가능”한지는 정량적으로 정의하기 어렵다. 기존 연구는 두 가지 접근법을 제시한다. 첫 번째는 시각화 자체의 특성을 수치화하는 휴리스틱(예: 클러스터 분리도)이며, 두 번째는 사용자 설문을 통한 주관적 평가이다. 이 논문은 두 접근법을 결합해, 사용자 선호 데이터를 기반으로 여러 품질 지표를 메타‑피처로 사용하고, 이를 통합하는 모델을 구축한다. 목표는 (1) 어떤 지표가 인간의 해석성 판단과 가장 잘 맞는지 확인하고, (2) 다중 지표를 결합했을 때 단일 지표보다 성능이 향상되는지를 검증하는 것이다. **2. 시각화 품질 지표** 두 종류의 지표를 사용한다. - *첫 번째 종류(투영 후 데이터만 사용)*: - **DSC (Distance Consistency)**: 각 점이 자신의 클래스 중심보다 다른 클래스 중심에 더 가깝게 위치하는 비율. - **HM (Hypothesis Margin)**: 같은 클래스와 다른 클래스 이웃 간 거리 차이의 평균. - **ABW (Average Between‑Within)**: 클래스 간 평균 거리와 클래스 내 평균 거리의 비율. - *두 번째 종류(원본·투영 데이터 모두 사용)*: - **NH AUC**: K‑최근접 이웃 집합을 원본과 투영에서 각각 구하고, 교집합 비율을 K에 대해 평균한 뒤, 다양한 K에 대한 곡선 아래 면적을 구한다. **3. 메타‑러닝 모델: 적응형 Cox 모델** 선호 학습은 쌍별 비교(v_i ≻ v_j) 형태의 데이터에 적합해야 한다. 저자는 Cox 비례 위험 모델의 부분가능도를 변형해 다음과 같이 정의한다. \

시각화 해석성 학습: 적응형 Cox 모델과 사용자 실험을 통한 품질 측정 결합

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기