분자 구조 보호를 위한 원자 수준 워터마킹 MolMark
초록
MolMark은 3차원 분자 데이터를 SE(3) 불변 특징으로 변환한 뒤, 원자 위치만을 미세하게 조정해 16비트 디지털 워터마크를 삽입한다. 임베딩 과정에서 화학적 안정성과 기능성을 유지하도록 설계되었으며, 회전·이동·반사와 같은 기하학적 변환에도 95% 이상의 워터마크 복원률을 달성한다. QM9·GEOM‑DRUG 데이터와 GeoBFN·GeoLDM 생성 모델을 대상으로 한 실험에서 분자 안정성·원자 안정성·후속 도킹 성능이 90% 이상 유지되는 것을 확인했다.
상세 분석
MolMark은 기존 멀티미디어나 단백질 워터마킹 기법을 그대로 적용할 수 없는 분자 특유의 제약을 정확히 짚어낸다. 첫 번째로, 분자는 원자 수가 적고 화학 결합에 대한 민감도가 매우 높아 작은 좌표 변동도 구조 붕괴를 초래할 수 있다. 이를 해결하기 위해 논문은 원자 위치(p)와 원자 특성(h)을 별도로 보존하면서, 위치만을 조정하는 방식을 채택한다. 위치 처리 모듈은 3D 좌표를 고차원 잠재공간으로 매핑해 충분한 레드던시를 제공하고, 원자 임베더는 원자 종류와 전하 정보를 사인‑코사인 포지셔널 인코딩과 결합해 풍부한 특징을 만든다. 엣지 임베더는 원자 간 거리와 연결 정보를 활용해 화학 결합 정보를 보존하도록 설계되었으며, 이는 워터마크가 구조적 제약을 위반하지 않도록 하는 핵심 요소다.
두 번째로, MolMark은 SE(3)‑불변 특징을 기반으로 워터마크를 삽입·복원한다. 입력 분자를 회전·이동·반사 등 변환한 뒤에도 동일한 특징 벡터를 얻을 수 있도록, 위치·원자·엣지 특징을 모두 SE(3)‑불변 형태로 정규화한다. 이렇게 하면 실제 실험실이나 시뮬레이션 환경에서 발생할 수 있는 좌표 변환에 강인한 워터마크 복원이 가능해진다.
세 번째로, 동적 균형 학습 전략을 도입해 손실 함수에 세 가지 목표를 동시에 최적화한다. (1) 원자 위치 변형을 최소화하는 재구성 손실, (2) 화학적 속성(예: 전자밀도, 결합 길이, 각도 등)을 유지하는 물성 손실, (3) 워터마크 복원 정확도를 높이는 교차 엔트로피 손실이다. 학습 중에 손실 가중치를 자동으로 조정함으로써, 과도한 위치 변형으로 인한 구조 파괴와 워터마크 검출률 저하 사이의 트레이드오프를 효과적으로 해결한다.
실험 결과는 MolMark의 실용성을 뒷받침한다. QM9와 GEOM‑DRUG 데이터셋에서 16비트 워터마크를 삽입했을 때, 원자 안정성(97.6% 이상)과 분자 안정성(94.6% 이상)이 유지되었으며, GeoBFN·GeoLDM 같은 최신 3D 생성 모델에 적용했을 때도 생성된 분자의 물리·화학적 특성이 거의 변하지 않았다. 특히 SE(3) 변환 후 워터마크 복원률이 95%를 초과했으며, 이는 기존 워터마킹 기법이 갖는 기하학적 취약점을 극복한 결과라 할 수 있다.
마지막으로, MolMark은 저작권 보호뿐 아니라 데이터 누수 탐지, 사용자 추적 등 다양한 보안 시나리오에 적용 가능하다. 논문에서 제시한 “Alice‑Elaine” 시나리오는 워터마크가 삽입된 분자를 여러 사용자에게 배포하고, 누수가 발생했을 때 해당 워터마크를 역추적해 책임자를 식별하는 과정을 보여준다. 이러한 응용은 제약·바이오 분야에서 연구 데이터와 신약 후보 물질을 안전하게 공유하는 데 큰 도움이 될 것으로 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기