다차원 매핑으로 보는 통합 워터마킹 프레임워크
초록
본 논문은 워터마킹을 1‑D 바이너리, 2‑D 공간 마스크, 3‑D 시공간 마스크라는 세 가지 차원으로 모델링하고, 임베딩 차원과 추출 차원의 조합에 따라 기능이 달라지는 “Dimension‑Aware Mapping”(DiM) 프레임워크를 제안한다. 영상 분야에 DiM‑V를 구현해 동일 네트워크 구조만으로 저작권 검증, 변조 위치 탐지, 프레임 순서 복구 등 다양한 워터마킹 기능을 실현한다.
상세 분석
DiM은 워터마크 정보를 “payload”라는 추상적인 다차원 텐서로 정의하고, 임베딩 함수 Eθ와 추출 함수 Dφ 사이의 차원 관계 M{de,dd}를 핵심 변수로 삼는다. 1‑D payload은 전역적인 바이너리 시퀀스로 저작권 확인에 적합하고, 2‑D payload은 H×W×C 형태의 공간 마스크로 영역별 무결성 검증을 가능하게 한다. 3‑D payload은 T×H×W×C 구조를 가지며, 프레임마다 서로 다른 채널 코드를 부여해 시간 순서와 프레임별 변조를 동시에 인코딩한다. 같은 차원 매핑(M{d,d})에서는 임베딩과 추출이 동일한 구조를 공유하므로 원본 payload을 거의 손상 없이 복원할 수 있어 정밀한 검증이 가능하다. 반면 차원 변환 매핑은 두 가지 형태로 나뉜다. Low‑to‑High(M{de<dd})는 저차원 바이너리를 고차원 공간에 퍼뜨려 지역화된 변조 탐지를 제공한다. 예를 들어 1‑D 메시지를 2‑D 마스크로 확장하면 특정 영역에만 워터마크가 존재하도록 설계할 수 있다. High‑to‑Low(M{de>dd})는 고차원 payload을 저차원 형태로 압축해 추출 복잡도를 낮추면서도 핵심 정보를 유지한다. 특히 3‑D payload을 1‑D 바이너리로 축소하면 프레임 순서 복구와 같은 시간적 의존성을 간결히 전달한다. 논문은 이러한 매핑 이론을 영상 도메인에 적용해 DiM‑V를 구현한다. 네트워크는 기본적인 인코더‑디코더 구조에 노이즈 레이어를 삽입해 다양한 공격(압축, 재생, 프레임 셔플 등)에 강인하도록 학습한다. 실험 결과, 동일 아키텍처에서 매핑만 바꿔도 (1) 전역 저작권 검증, (2) 시공간 변조 위치 탐지, (3) 프레임 순서 복구라는 세 가지 상이한 기능을 달성함을 확인했다. 이는 기존 워터마킹 연구가 기능별로 별도 설계해야 했던 문제를 근본적으로 해소한다는 점에서 의의가 크다. 또한 다차원 payload을 활용하면 향후 물리적 공격(프레임 삭제, 재배열)이나 복합적인 변조 시나리오에도 확장 가능한 방어 메커니즘을 설계할 수 있다. 다만 현재 실험은 주로 합성 공격에 국한돼 있어 실제 배포 환경에서의 성능 검증이 필요하고, 고차원 payload의 저장·전송 비용이 증가하는 점도 고려해야 한다.
댓글 및 학술 토론
Loading comments...
의견 남기기