텍스트투비디오 생성기 Sora의 암묵적 연관성을 정량화한 VEAT와 편향 완화 과제
📝 원문 정보
- Title: VEAT Quantifies Implicit Associations in Text-to-Video Generator Sora and Reveals Challenges in Bias Mitigation
- ArXiv ID: 2601.00996
- 발행일: 2026-01-02
- 저자: Yongxu Sun, Michael Saxon, Ian Yang, Anna-Maria Gueorguieva, Aylin Caliskan
📝 초록 (Abstract)
최근 텍스트투비디오(T2V) 생성기인 Sora가 사회적 편향을 재현할 가능성이 제기되고 있다. 기존의 단어·이미지 임베딩 수준에서 연관성을 정량화하던 연구를 비디오 영역으로 확장하고자, 본 논문은 Video Embedding Association Test(VEAT)와 Single‑Category VEAT(SC‑VEAT)라는 두 가지 새로운 방법을 제안한다. IAT와 OASIS 이미지 카테고리 등 널리 인정된 기준을 재현함으로써 방법의 타당성을 검증하였다. 인종(아프리카계 미국인 vs. 유럽계 미국인)과 성별(남성 vs. 여성) 차원에서(1) 쾌감(pleasant vs. unpleasant)과(2) 7개 상·17개 직업에 대한 연관성을 측정하였다. 유럽계 미국인이 아프리카계 미국인보다 쾌감과 강하게 연관되고, 여성도 남성보다 쾌감과 강하게 연관되는 것이 d > 0.8의 큰 효과크기로 나타났다. 또한 인종·성별 편향의 효과크기는 해당 직업·상 수상자의 실제 인구통계와 높은 양의 상관관계(r = 0.93~0.99)를 보였다. 이는 T2V 생성기의 편향이 과거의 직업·수상 분포를 반영한다는 것을 의미한다. 편향 완화를 위해 명시적 프롬프트를 적용했을 때 효과크기가 점진적으로 감소했지만, 일부 흑인‑관련 직업(청소원, 우편 업무)은 오히려 흑인과의 연관성이 강화되는 역효과가 관찰되었다. 따라서 무분별한 프롬프트 기반 완화는 기존 편향을 악화시킬 위험이 있다. 본 연구는 접근성이 높은 T2V 생성기가 적절한 평가와 책임 있는 배포 없이는 대표성 해를 증폭시킬 수 있음을 경고한다.💡 논문 핵심 해설 (Deep Analysis)

실험 결과는 두 가지 주요 메시지를 전달한다. 첫째, Sora는 인종·성별에 따라 쾌감과 부정적 감정의 연관성을 명확히 구분한다는 점이다. d > 0.8이라는 큰 효과크기는 인간 수준의 편향과 유사하거나 그 이상임을 시사한다. 둘째, 이러한 편향은 실제 사회의 직업·수상 분포와 높은 상관관계를 보이며, 모델이 학습 데이터에 내재된 구조적 불평등을 그대로 반영한다는 것을 보여준다. 특히, 직업군별 남성·여성 비율, 백인·흑인 비율과의 r = 0.93~0.99은 통계적으로 거의 완벽에 가까운 일치성을 의미한다.
편향 완화 실험에서는 ‘explicit debiasing prompts’를 삽입함으로써 전반적인 효과크기가 감소했지만, 일부 흑인‑관련 직업에서는 오히려 편향이 강화되는 역효과가 나타났다. 이는 프롬프트가 단순히 ‘공정성’이라는 레이블을 추가하는 것이 아니라, 모델의 내부 확률 분포를 재조정하면서 의도치 않은 방향으로 이동시킬 수 있음을 경고한다. 즉, 프롬프트 기반 완화는 상황에 따라 ‘보정’이 아니라 ‘증폭’ 역할을 할 위험이 있다.
한계점으로는(1) 비디오 임베딩의 품질이 모델마다 크게 다를 수 있어, VEAT 결과가 특정 모델에 종속적일 가능성, (2) 프롬프트 설계가 주관적이며, 실험에 사용된 프롬프트가 최적이라고 보장할 수 없다는 점, (3) 문화·언어적 다양성을 충분히 반영하지 못한 데이터셋으로 인해 편향 측정이 서구 중심적일 수 있다는 점을 들 수 있다. 향후 연구는(가) 다양한 T2V 모델과 멀티언어 데이터에 대한 교차 검증, (나) 프롬프트 외에 모델 자체의 파라미터 조정이나 사전 학습 데이터 정제와 같은 구조적 완화 방안을 탐색해야 한다.
결론적으로, VEAT와 SC‑VEAT는 텍스트투비디오 분야에서 편향을 체계적으로 진단할 수 있는 강력한 도구이며, 정책 입안자와 개발자는 이러한 정량적 지표를 활용해 ‘보이지 않는’ 대표성 해를 사전에 차단해야 할 책임이 있다.
📄 논문 본문 발췌 (Excerpt)
📸 추가 이미지 갤러리
