인공지능 생성 이미지 탐지를 위한 대규모 COCO 기반 데이터셋 공개
📝 원문 정보
- Title: A Comprehensive Dataset for Human vs. AI Generated Image Detection
- ArXiv ID: 2601.00553
- 발행일: 2026-01-02
- 저자: Rajarshi Roy, Nasrin Imanpour, Ashhar Aziz, Shashwat Bajpai, Gurpreet Singh, Shwetangshu Biswas, Kapil Wanaskar, Parth Patwa, Subhankar Ghosh, Shreyas Dixit, Nilesh Ranjan Pal, Vipula Rawte, Ritvik Garimella, Gaytri Jena, Vasu Sharma, Vinija Jain, Aman Chadha, Aishwarya Naresh Reganti, Amitava Das
📝 초록 (Abstract)
멀티모달 생성 AI 시스템인 Stable Diffusion, DALL‑E, MidJourney 등이 합성 이미지 제작 방식을 혁신하고 있다. 이러한 기술은 창의적 활용을 촉진하지만, 동시에 허위·조작된 시각 콘텐츠 확산 위험을 높인다. 실제 사진과 구분이 어려워진 현 상황에서 이미지 진위 판별은 시급한 과제로 대두된다. 이를 해결하고자 본 연구는 MS COCO를 기반으로 96 000개의 실제·합성 이미지 샘플을 포함하는 새로운 데이터셋 MS COCOAI를 공개한다. 합성 이미지는 Stable Diffusion 3, Stable Diffusion 2.1, SDXL, DALL‑E 3, MidJourney v6 등 다섯 가지 최신 모델을 이용해 생성하였다. 데이터셋을 활용한 두 가지 과제는 (1) 이미지가 실제인지 생성된 것인지 분류하고, (2) 합성 이미지의 경우 어느 모델이 생성했는지를 식별하는 것이다. 데이터셋은 https://huggingface.co/datasets/Rajarshi-Roy-research/Defactify_Image_Dataset 에서 제공된다.💡 논문 핵심 해설 (Deep Analysis)
본 논문이 제시하는 MS COCOAI 데이터셋은 현재 이미지 진위 탐지 연구에서 가장 시급히 요구되는 ‘다양성’과 ‘규모’를 동시에 만족한다는 점에서 큰 의미를 가진다. 첫째, 기존 데이터셋들은 주로 단일 생성 모델이나 제한된 프롬프트 세트를 사용해 만든 이미지에 국한돼 있었으며, 이는 실제 현장에서 마주치는 다양한 AI 툴과의 격차를 초래한다. 반면 본 데이터셋은 Stable Diffusion 3·2.1·SDXL, DALL‑E 3, MidJourney v6 등 최신 모델을 모두 포함함으로써, 현재 시장에서 널리 사용되는 주요 생성 엔진을 포괄한다. 이는 탐지 모델이 특정 엔진에 과적합(overfit)되는 위험을 감소시키고, 모델 간 일반화 성능을 평가할 수 있는 기반을 제공한다.둘째, 96 000개의 샘플이라는 대규모는 딥러닝 기반 탐지기 학습에 충분한 데이터 양을 보장한다. 특히 실제 이미지와 합성 이미지가 1:1 비율로 균형을 이루고 있어, 클래스 불균형 문제를 최소화한다. 이는 정확도뿐 아니라 정밀도·재현율·F1‑score 등 다양한 평가 지표에서 신뢰할 수 있는 결과를 도출하도록 돕는다.
셋째, 두 가지 과제 설정은 연구 커뮤니티에 실용적인 방향성을 제시한다. 첫 번째 과제인 ‘진위 이진 분류’는 가장 기본적인 방어 메커니즘으로, 소셜 미디어 플랫폼이나 뉴스 검증 시스템에 바로 적용 가능하다. 두 번째 과제인 ‘모델 식별’은 생성 이미지의 출처를 추적함으로써 책임 소재를 명확히 하고, 악의적 사용을 억제하는 데 기여한다. 특히 모델 식별은 향후 ‘AI 워터마킹’ 기술과 결합해 보다 정교한 추적 체계를 구축할 수 있는 토대를 제공한다.
하지만 몇 가지 한계도 존재한다. 첫째, 데이터셋이 MS COCO 이미지에 국한돼 있어, 풍경·인물·일상 등 제한된 도메인에 편중될 위험이 있다. 실제 현장에서는 의료 영상, 위성 사진 등 다양한 분야의 이미지가 혼재하는데, 이러한 도메인 전이 성능은 별도 검증이 필요하다. 둘째, 프롬프트 설계가 공개되지 않았을 경우 재현성이 저하될 수 있다. 프롬프트 다양성을 확보하고 공개함으로써 향후 연구자가 동일 조건에서 실험을 재현할 수 있도록 하는 것이 바람직하다. 셋째, 최신 모델이 지속적으로 업데이트됨에 따라 데이터셋이 빠르게 구식이 될 가능성이 있다. 따라서 지속적인 데이터셋 업데이트와 버전 관리가 필요하다.
종합적으로, MS COCOAI는 AI 생성 이미지 탐지 분야에 실질적인 연구 기반을 제공하며, 정책 입안자·플랫폼 운영자·학계가 협력해 신뢰할 수 있는 시각 정보 생태계를 구축하는 데 중요한 역할을 할 것으로 기대된다.