비디오베리타스: 인식 프리텍스트 강화학습으로 AI 생성 비디오 탐지 혁신

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 다중모달 대형 언어 모델(MLLM)의 추론 능력은 뛰어나지만 세밀한 시공간 인식이 부족한 문제를 해결하고자, 인식 프리텍스트 강화학습(PPRL)과 공동 선호 정렬(Joint Preference Alignment)을 결합한 두 단계 학습 파이프라인인 VideoVeritas를 제안한다. 또한 9개 최신 생성기에서 만든 3천 개 비디오와 실제 플랫폼에서 수집한 사실 오류 비디오를 포함한 고품질 평가 데이터셋 MintVid를 공개한다. 실험 결과, 기존 방법이 얕은 시각적 특징이나 기계적 분석에 치우친 반면, VideoVeritas는 세밀한 객체 인식과 사실 기반 추론을 균형 있게 수행하여 다양한 벤치마크에서 우수한 성능을 보인다.

상세 분석

VideoVeritas는 현재 MLLM 기반 AI‑generated 비디오 탐지 연구의 두 가지 핵심 한계를 동시에 공략한다. 첫 번째는 “인식 격차”이다. 최신 Gemini‑3.0, GPT‑5.1 등은 텍스트‑비디오 이해와 논리적 추론에서는 뛰어나지만, 객체 단위의 시공간 구분, 물리적 연속성, 상호작용 등 인간이 직접 눈으로 확인할 수 있는 미세한 아티팩트를 포착하는 데 한계가 있다. 두 번째는 “목표 지향 파인튜닝”의 부작용이다. 기존 SFT 혹은 RL이 탐지 라벨에만 초점을 맞추면 모델이 데이터셋에 과도하게 적합해 얕은 패턴(예: 조명, 배경 색상)만 학습하게 되고, 사실 기반 질문에 대한 논리적 추론 능력이 저하된다.

이를 해결하기 위해 저자들은 두 단계 학습 전략을 설계했다. ① Joint Preference Alignment 단계에서는 비디오별로 “아티팩트‑지향 질문‑답변(QA) 보고서”를 자동 생성하고, 이를 기반으로 응답 수준과 비디오 수준의 선호 쌍(preference pairs)을 만든다. 여기서 “anti‑label” 전략을 사용해 역 라벨(예: ‘fake’를 ‘real’로 바꾸어 입력)으로 모델의 내재적 환각을 유도하고, 이를 비선호 응답으로 지정한다. 또한 사실 기반 비디오(v_r)에서는 베이스 모델 자체의 추론을 선호 응답으로 활용해, 모델이 스스로 생성한 논리 흐름을 강화한다. ② Perception Pretext Reinforcement Learning(PPRL) 단계에서는 탐지 라벨이 아닌 두 가지 단순 인식 프리텍스트 과업을 RL 보상으로 사용한다. 첫 번째는 일반적인 시공간 grounding(시간‑좌표와 바운딩 박스를 정확히 제시)이며, 두 번째는 자기 지도식 객체 카운팅(동그라미·사각형·삼각형 개수)이다. 이러한 과업은 라벨이 풍부하지 않은 상황에서도 대규모 비디오에 적용 가능하고, 모델이 “객체를 분리·추적·계산”하는 기본 능력을 내재화하도록 만든다.

실험 설계는 새롭게 구축한 MintVid 데이터셋을 중심으로 진행된다. MintVid은 (1) 6개 상용 생성기에서 만든 1.5K 고품질 T2V·TI2V 비디오, (2) 3개 공개 모델 기반 2K 딥페이크, (3) 짧은 동영상 플랫폼에서 수집한 사실 오류 비디오(예: 음식 재료가 갑자기 사라지는 등)로 구성된다. 기존 GenVideo·GenVidBench와 달리 최신 모델의 높은 시간 일관성을 반영하고, 사실 기반 추론을 요구하는 시나리오까지 포함한다.

성능 평가에서는 기존 DeMamba, RestraV 같은 이진 탐지기와 Skyra(MLLM 기반 Cold‑Start), BusterX++(Pure RL) 등을 비교한다. 결과는 VideoVeritas가 전체 정확도·재현율·F1에서 평균 4~7%p 상승했으며, 특히 사실 기반 서브셋에서 재현율이 15%p 이상 개선되는 등 균형 잡힌 성능을 보여준다. 또한 모델 행동 분석(그림 2)에서 PPRL 적용 후 “Component Granularity”(객체 단위 구분)와 “Physics Depth”(물리적 연속성) 항목에서 각각 76.5%·68.3%의 승률을 기록, 인식 프리텍스트가 추론 행동을 실제 인간 인지와 유사하게 변형시켰음을 입증한다.

이 논문의 주요 기여는 다음과 같다. (1) 라벨이 거의 없는 상황에서도 적용 가능한 인식 프리텍스트 RL 알고리즘을 제시, 기존 RL 기반 탐지기의 과도한 표면 분석 문제를 완화한다. (2) Joint DPO와 anti‑label 전략을 결합한 선호 정렬 프레임워크를 도입해, 베이스 MLLM의 내재적 지식을 효과적으로 활용한다. (3) 최신 생성기와 실제 플랫폼 데이터를 포괄하는 MintVid를 공개, 향후 비디오 위조 탐지 연구에 표준 벤치마크를 제공한다.

전반적으로 VideoVeritas는 “인식 → 추론 → 탐지”라는 순환 구조를 명확히 정의하고, 각각을 독립적인 학습 목표로 분리함으로써 MLLM의 약점을 보완한다. 향후 연구에서는 더 복잡한 물리 시뮬레이션, 멀티‑에이전트 상호작용, 그리고 실시간 스트리밍 환경에서의 경량화 적용이 기대된다.

비디오베리타스: 인식 프리텍스트 강화학습으로 AI 생성 비디오 탐지 혁신

초록

상세 분석

댓글 및 학술 토론

의견 남기기