AI 시대 창작 소유권: 폐쇄 연산으로 보는 침해와 허용
초록
**
본 논문은 기존 저작권의 “실질적 유사성” 기준이 AI 생성물에 부적합함을 지적하고, 훈련 코퍼스에 포함된 특정 작품 없이는 해당 출력이 생성될 수 없다는 반사실적 기준을 제안한다. 이를 위해 생성 시스템을 보존·단조·멱등성을 갖는 폐쇄 연산으로 모델링하고, 허용 가능한 출력 집합의 구조적 특성과 코퍼스 규모가 무한대로 커질 때 나타나는 두 가지 극단적 경향(가벼운 꼬리 vs 무거운 꼬리)을 분석한다. 가벼운 꼬리 분포에서는 규제가 실질적 제약을 잃고, 무거운 꼬리에서는 지속적인 제한이 존재한다는 결론을 도출한다.
**
상세 분석
**
논문은 먼저 저작권 침해 판단의 전통적 기준인 “실질적 유사성”(substantial similarity)이 스타일 모방을 통한 AI 생성물에 대해 충분히 보호하지 못한다는 점을 법리적·실증적 사례(Andersen v. Stability AI, NYT v. OpenAI 등)와 함께 제시한다. 이를 보완하기 위해 저자들은 “반사실적(infringement iff cannot be generated without the work)”이라는 새로운 침해 기준을 정의한다. 핵심은 특정 작품이 훈련 데이터에 포함되지 않으면 해당 출력이 생성될 확률이 0에 수렴한다는 가정이다.
이를 수학적으로 구현하기 위해 생성 시스템을 폐쇄 연산자(closure operator) 로 모델링한다. 폐쇄 연산자는 세 가지 성질을 만족한다:
- 보존(Preservation) – 기존 코퍼스의 모든 원소는 그대로 출력에 포함된다.
- 단조성(Monotonicity) – 코퍼스가 확대되면 생성 가능한 집합도 확대된다.
- 멱등성(Idempotence) – 한 번 적용한 뒤 다시 적용해도 집합이 변하지 않는다.
이러한 연산자는 실제 AI 모델이 “훈련 → 생성” 과정을 반복하면서 새로운 창작물을 추가해도 본질적으로 같은 결과 공간을 탐색한다는 점을 형식화한다. 논문은 구체적인 예시(볼록 껍질 생성기, 스플라이스 생성기, 박스 생성기)를 통해 폐쇄 연산이 어떻게 기존 작품의 특징을 조합하거나 재배열해 새로운 출력으로 매핑되는지를 보여준다.
다음으로 침해 집합(Violation Set) 과 허용 집합(Permissible Set) 을 정의한다. 침해 집합은 적어도 하나의 기존 작품에 의존해 생성될 수 없는 출력들의 모임이며, 허용 집합은 그 여집합이다. 주요 정리들은 허용 집합이 코퍼스가 커질수록 단조적으로 확대되고, 폐쇄 연산에 대해 닫혀 있음을 증명한다(Prop 1). 또한 라돈 수(Radon number)와 연결된 충분조건을 통해 허용 집합이 비어 있지 않음을 보장한다(Corollary 1).
가장 혁신적인 부분은 대규모 코퍼스 한계에 대한 비대칭적 결과이다. 저자들은 새로운 창작물이 가벼운 꼬리(light‑tailed) 분포를 따를 때와 무거운 꼬리(heavy‑tailed) 분포를 따를 때를 구분한다. 가벼운 꼬리 경우, 극단적인 창작물이 거의 발생하지 않으므로 코퍼스가 충분히 커지면 모든 출력이 다중 경로를 통해 생성 가능해져 개별 작품에 대한 의존성이 사라진다. 이는 Theorem 1에서 “허용 비율 → 1 (almost surely)” 로 수학적으로 표현된다. 반대로 무거운 꼬리 분포에서는 소수의 고임팩트 작품이 지속적으로 핵심적인 생성 원천이 되며, 이들에 대한 의존성이 사라지지 않는다. 따라서 허용 비율이 일정 수준 이하로 유지되어 규제가 실질적인 제약을 가한다.
법리적 함의는 두드러진다. 기존 “실질적 유사성” 기준은 스타일 모방을 규제하지 못하지만, 반사실적 기준은 데이터 사용 자체를 침해 여부의 핵심 요소로 만든다. 이는 훈련 데이터의 투명성, 저작권자 동의 절차, 그리고 AI 모델의 “대체 가능성”을 평가하는 새로운 법적 프레임워크를 요구한다. 또한, 창작 과정이 가벼운 꼬리인지 무거운 꼬리인지에 따라 정책 입안자는 규제 강도를 달리 적용할 근거를 제공한다.
마지막으로, 논문은 경제학적 문헌(예: Gans 2024, Yang & Zhang 2025)과 연결해, 제안된 반사실적 기준이 라이선싱·소송·규제 모델에 어떻게 통합될 수 있는지를 제시한다. 특히, 허용 집합의 구조적 특성을 이용해 라이선스 비용을 최소화하거나 공정 사용(fair use) 한계를 정량화하는 데 활용 가능함을 시사한다. 전체적으로 이 연구는 AI 생성물에 대한 저작권 이론을 수학적 폐쇄 연산이라는 새로운 시각으로 재구성하고, 창작 활동의 통계적 특성에 따라 규제 효과가 달라진다는 중요한 통찰을 제공한다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기