RISE 공정성 진단을 위한 인터랙티브 시각화 도구

RISE 공정성 진단을 위한 인터랙티브 시각화 도구
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

RISE는 정렬된 잔차를 시각화해 모델의 오류 분포와 그룹별 편향을 직관적으로 보여주는 인터랙티브 시스템이다. 잔차 곡선의 형태와 “쌍무릎”(twin knees) 위치를 분석해 평균 정렬도(F mean), 수평·수직 무릎 편차(F shift, F acc)라는 세 가지 지표를 도출하고, 이를 기존 정확도·DP·MD와 함께 제공한다. 도메인 이동 상황에서도 지역적 불공정성을 발견하고, 정확도‑공정성 트레이드오프를 시각적으로 평가한다.

상세 분석

RISE는 머신러닝 모델의 예측 오류를 signed‑error residual (d_i = \hat p_i - y_i) 로 정의하고, 이를 전체 데이터셋에 대해 오름차순 정렬한다. 정렬된 잔차를 x축(순위), y축(잔차값)에 매핑한 곡선은 S‑shape을 띠며, 중앙에 가까울수록 정확도가 높고 양쪽 꼬리로 갈수록 오류가 커진다. 핵심 아이디어는 이 곡선을 그룹별(예: 민감속성 (a=0,1))로 오버레이하고, 각 그룹의 중앙값 정렬 정도와 곡선의 변곡점(“무릎”)을 비교함으로써 편향을 정량화한다.

먼저, 그룹별 중앙값 (m_0, m_1)을 전체 중앙값 (m_g)와 비교해 정렬 편차 (\tilde m_0, \tilde m_1)를 구하고, 이를 이용해 F mean (=1-\frac{|\tilde m_0-\tilde m_1|}{2}) 를 정의한다. F mean은 1에 가까울수록 두 그룹의 오류 분포가 균형을 이루며, 값이 낮으면 시스템적 편향을 의미한다.

다음으로, Kneedle 알고리즘을 적용해 전체와 각 그룹의 좌·우 무릎 좌표 ((d_{ℓ},\bar h_{ℓ})), ((d_{r},\bar h_{r}))를 추출한다. 무릎은 오류가 급격히 증가하기 시작하는 임계점으로, 그룹마다 무릎 위치가 다르면 특정 퍼센타일 구간에서 편향이 발생한다는 신호다. 무릎의 수평 편차 (H_{ℓ}, H_{r})와 수직 편차 (V_{ℓ}, V_{r})를 전체 무릎 좌표로 정규화해 각각 F shift (= \frac12(|H_{ℓ}|+|H_{r}|)) 와 F acc (= \frac12(|V_{ℓ}|+|V_{r}|)) 를 계산한다. 두 지표는 낮을수록 그룹 간 오류 전이 시점과 규모가 일치함을 의미한다.

RISE는 이러한 지표를 기존의 정확도(Acc), 인구통계적 평등(DP), 평균 차이(MD)와 함께 표 형태로 제시한다. 인터랙티브 UI에서는 (1) 전체와 그룹별 잔차 곡선, (2) 중앙값 라인(“median ruler”)의 정렬 정도, (3) 쌍무릎 표시, (4) 적응형 세그멘테이션을 통한 지역적 편향 시각화를 제공한다. 사용자는 데이터셋, 민감속성, 모델을 실시간으로 전환하면서 시각적 변화를 즉시 확인할 수 있다.

실험에서는 BDD100K 데이터셋을 활용해 날씨(맑음 vs. 비)라는 도메인 이동을 시뮬레이션하고, IRM(공정성 중심), MBDG(정확성 중심), IGA(균형) 세 모델을 비교한다. 표 2와 그림 2에서 볼 수 있듯이, IRM은 무릎 위치와 크기가 거의 일치해 F shift·F acc이 거의 0에 가깝지만 전체 정확도가 낮다. 반면 MBDG는 높은 정확도와 높은 F mean을 보이지만 무릎이 비대칭적으로 이동해 지역적 편향을 숨긴다. IGA는 세 지표가 모두 중간 수준으로, 시각적으로도 곡선이 평탄하고 그룹 간 차이가 최소화된 ‘이상적인’ 형태를 보여준다.

RISE의 강점은 (1) 스칼라 메트릭이 놓치기 쉬운 오류 분포의 미세 구조를 드러낸다, (2) 도메인 이동 상황에서도 특정 퍼센타일 구간에 집중된 편향을 식별한다, (3) 시각적 피드백을 통해 모델 선택·튜닝 과정에서 직관적인 의사결정을 지원한다는 점이다. 한계로는 현재 이진 분류와 이진 민감속성에 초점을 맞추었으며, 다중 클래스·다중 속성 상황에서는 무릎 탐지와 지표 정의가 복잡해질 수 있다. 향후 연구에서는 다중 클래스, LLM 기반 시스템의 토큰‑레벨 잔차, 텍스트·이미지 등 다양한 모달리티에 대한 확장을 계획하고 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기