시각적 협업을 통한 딥러닝 의미 추론 인터페이스
초록
본 논문은 인간과 딥러닝 모델이 시각적 메타포를 공유하며 상호작용할 수 있도록 설계된 ‘협업 의미 추론(CSI)’ 프레임워크를 제안한다. 모델 내부의 중간 추론 과정을 ‘훅(hook)’이라는 이산 잠재 변수로 노출하고, 사용자는 이를 시각화된 형태로 관찰·조정함으로써 모델의 예측을 이해하고 직접 shaping할 수 있다. 문서 요약 시스템을 사례로 구현해 가능성을 입증한다.
상세 분석
이 논문은 인간‑AI 협업을 위한 인터페이스 설계와 모델 구조 자체의 변형을 동시에 고려한다는 점에서 기존 XAI 연구와 차별화된다. 먼저 저자들은 시각적 분석과 인터랙션 디자인을 결합한 ‘협업 의미 추론(Collaborative Semantic Inference, CSI)’라는 개념을 정의한다. CSI는 (1) 모델 예측을 시각적 메타포로 표현, (2) 사용자가 그 메타포에 의미 기반 상호작용을 수행, (3) 모델이 사용자의 피드백을 내부 추론 흐름에 반영하는 삼단계 대화를 전제로 한다. 핵심 기술은 모델에 ‘훅(hook)’이라 부르는 이산 잠재 변수를 삽입해 중간 의사결정 포인트를 명시적으로 드러내는 것이다. 이러한 훅은 ‘what‑if’ 분석을 가능하게 하며, 사용자는 특정 출력이 어떤 내부 선택에 의해 도출됐는지 역추적할 수 있다.
논문은 기존 시각화·해석 도구를 ‘수동 관찰’, ‘상호작용 관찰’, ‘상호작용 협업’이라는 세 단계 통합 수준으로 재분류한다. 특히 ‘상호작용 협업’ 단계는 모델 파라미터 자체를 사용자의 피드백으로 수정하거나, 출력 자체를 사용자가 직접 조정하면서 모델 내부 상태를 재계산하는 ‘역방향(interactive backward)’ 인터랙션을 지원한다. 이는 기존 LIME, SHAP 등 사후 해석 기법이 제공하는 전방향(입력→출력) 설명을 넘어, 사용자가 원하는 출력에 맞춰 모델 내부 경로를 직접 재구성할 수 있게 한다.
구현 사례로 제시된 문서 요약 시스템은 텍스트 요약 모델에 잠재 토픽 변수와 문장 선택 변수를 훅으로 삽입한다. 사용자는 요약 결과를 시각화된 트리 구조로 확인하고, 특정 문장이 포함되지 않은 경우 해당 문장을 ‘활성화’하거나 ‘비활성화’하는 조작을 수행한다. 시스템은 사용자의 조작을 반영해 새로운 요약을 즉시 재생성하고, 그 과정에서 내부 토픽 분포와 문장 가중치가 어떻게 변했는지를 시각적으로 보여준다. 이를 통해 사용자는 모델이 왜 특정 문장을 선택했는지, 어떤 토픽이 강조되었는지를 직관적으로 이해하고, 필요에 따라 직접 shaping할 수 있다.
기술적 난점으로는 (1) 다양한 입력 형태(텍스트, 이미지, 스펙트로그램 등)에 대해 일반화 가능한 훅 설계, (2) 실시간 역방향 인터랙션을 지원하기 위한 모델 재학습 비용, (3) 사용자가 모델 내부 메커니즘을 오해하지 않도록 하는 인터페이스 설계가 있다. 저자들은 이러한 문제를 해결하기 위해 (i) 모델‑인터페이스 공동 설계 프로세스를 제안하고, (ii) 사용자 역할(아키텍트, 트레이너, 엔드유저)에 따라 맞춤형 시각화와 인터랙션을 제공한다.
전체적으로 이 논문은 딥러닝 모델을 ‘검은 상자’에서 ‘투명한 협업 파트너’로 전환하기 위한 구체적 설계 원칙과 구현 방안을 제시한다. 특히 중간 추론을 명시적으로 노출하고, 사용자가 시각적 메타포를 통해 직접 모델 흐름을 조작하도록 허용하는 접근은 향후 인간‑AI 협업 인터페이스 설계에 중요한 이정표가 될 것으로 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기