코드 아크로스틱: 코드 생성용 강인한 워터마킹

읽는 시간: 2 분
...

📝 원문 정보

  • Title: CODE ACROSTIC: Robust Watermarking for Code Generation
  • ArXiv ID: 2512.14753
  • 발행일: 2025-12-14
  • 저자: Li Lin, Siyuan Xin, Yang Cao, Xiaochun Cao

📝 초록 (Abstract)

대형 언어 모델(LLM)의 워터마킹은 가짜 뉴스 제작, 표절, 스팸 등 악용을 방지하는 데 필수적이다. 특히 LLM이 생성한 코드는 지적 재산권과 직결되므로 워터마킹이 중요하다. 그러나 기존 코드 워터마킹 기법은 주석 제거 공격에 취약한 것으로 드러났다. 공격자는 기능에는 영향을 주지 않는 주석을 삭제함으로써 현재 워터마크의 검출 가능성을 크게 낮출 수 있다. 한편, 코드 자체는 자연어에 비해 엔트로피가 낮아 워터마크 삽입이 어렵다. 본 연구는 이러한 문제를 해결하기 위해 ‘Cue List’라 불리는 단어 목록을 활용한다. Cue List는 코드 내에서 고엔트로피(다양한 표현이 가능한)와 저엔트로피(고정된 구조를 갖는) 부분을 구분하는 사전 지식이다. 저엔트로피 영역에는 최소한의 변형만을 가하고, 고엔트로피 영역에 Cue List에 기반한 워터마크를 삽입한다. 이를 통해 기존 방법보다 높은 검출률과 사용성을 달성하였다. HumanEval 벤치마크에서 제안 방법을 세 가지 최신 코드 워터마킹 기법과 비교 실험했으며, 제안 방식이 효과적임을 입증하였다.

💡 논문 핵심 해설 (Deep Analysis)

Figure 1
본 논문은 LLM 기반 코드 생성 시스템에서 워터마크를 안정적으로 삽입·검출하기 위한 새로운 프레임워크를 제시한다. 기존 연구들은 주로 자연어 텍스트에 초점을 맞추어, 토큰 빈도와 확률 분포를 조작함으로써 워터마크를 구현했다. 그러나 코드의 경우, 변수명, 함수명, 주석 등은 비교적 제한된 어휘 집합에 의존하고, 문법적 제약이 강해 무작위 삽입이 곧 컴파일 오류나 실행 오류를 초래한다. 특히, 주석은 인간이 코드를 이해하는 데 도움을 주지만, 실행에는 전혀 영향을 주지 않기 때문에 공격자는 가장 쉬운 방법으로 주석 전체를 삭제한다. 이런 ‘주석 제거 공격’은 현재 워터마크가 주석에 은닉돼 있는 경우 완전한 무력화를 가져온다.

논문은 이 문제를 두 가지 관점에서 접근한다. 첫째, 코드의 저엔트로피 구역(예: 고정된 API 호출, 표준 라이브러리 사용)과 고엔트로피 구역(예: 자유롭게 이름을 붙일 수 있는 변수·함수명, 복잡한 로직) 을 사전에 정의한다. 이를 위해 ‘Cue List’라는 단어 목록을 구축했으며, 이 목록은 도메인 지식(예: 흔히 사용되는 함수명, 데이터 구조)과 통계적 분석을 결합해 생성된다. 둘째, 워터마크는 고엔트로피 구역에만 삽입한다. 구체적으로는 변수·함수명에 미세한 변형(예: 접미사 추가, 대소문자 교체)을 적용하…

📄 논문 본문 발췌 (Translation)

...(본문 내용이 길어 생략되었습니다. 사이트에서 전문을 확인해 주세요.)

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키