강인한 바이너리 코드(RBC) 기반 LLM 워터마킹: 오류정정코드로 품질·검출·내구성 동시 확보

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 대형 언어 모델(Large Language Model)의 생성 텍스트에 인간이 감지하기 어려운 통계적 신호를 삽입하는 워터마크 기법을 제안한다. 오류정정코드(ECC)를 활용한 ‘Robust Binary Code(RBC)’ 워터마크는 토큰 수준에서 분포를 왜곡하지 않으며, 짧은 텍스트에서도 높은 검출력을 보인다. 또한 편집, 삭제, 번역 등 다양한 공격에 대해 강인한 복원 능력을 입증한다. 이론적 분석을 통해 엔트로피와 검출 가능성의 관계를 밝히고, 실험적으로 기존 최첨단 방법보다 품질·속도·내구성에서 우수함을 확인한다.

상세 분석

RBC 워터마크는 두 핵심 아이디어로 구성된다. 첫째, 언어 모델의 토큰을 고정 길이 비트열(ℓ≈log₂|V|)로 변환한 뒤, 이전 w_in 토큰을 슬라이딩 윈도우로 사용해 임의성 높은 메시지 M∈{0,1}^k을 생성한다. 여기서 XOR 연산으로 무작위 비트열 R을 섞어 M의 독립성을 보장한다. 둘째, M을

강인한 바이너리 코드(RBC) 기반 LLM 워터마킹: 오류정정코드로 품질·검출·내구성 동시 확보

초록

상세 분석

댓글 및 학술 토론

의견 남기기