DNA 시뮬레이션 기반 가짜 암호화 기법
초록
본 논문은 실제 DNA를 사용하지 않고, 중앙 교리(전사·스플라이싱·번역) 과정을 소프트웨어적으로 모방한 ‘가짜 DNA 암호화’ 방법을 제안한다. 평문을 2비트 → 염기(A,C,G,T) 변환 후, 시작 코드와 패턴 코드로 정의된 스플라이싱을 수행해 mRNA를 만들고, 이를 유전 코드 표에 따라 단백질 서열로 변환한다. 키는 스플라이싱 규칙과 코돈‑아미노산 매핑으로 구성되며, 암·복호화 모두 O(n) 시간 복잡도를 가진다. 저자는 이 방법이 저장·전송 효율이 높고, 무차별 대입 공격에 대해 O(2ⁿ) 수준의 보안을 제공하지만, 선택 평문 공격 등에 취약함을 인정한다. 향후 다중 라운드와 일회용 패드 결합 등으로 보완을 제안한다.
상세 분석
이 논문은 DNA 암호학의 실험적 한계를 극복하고자, 실제 생물학적 시료를 사용하지 않는 ‘의사 DNA(Pseudo‑DNA)’ 암호 체계를 설계한다. 핵심 아이디어는 중앙 교리(Central Dogma)의 세 단계—전사(transcription), 스플라이싱(splicing), 번역(translation)—를 알고리즘적으로 재현하는 것이다. 구체적으로, 평문을 2비트 단위로 00‑A, 01‑C, 10‑G, 11‑T 로 매핑해 가상의 DNA 서열을 만든 뒤, 사전에 정의된 ‘시작 코드(start codon)’와 ‘패턴 코드(pattern code)’에 따라 비연속적인 인트론(intron) 구간을 제거한다. 이때 패턴 코드는 연속적인 구간이 아니라 스프레드된 위치 집합을 지정함으로써, 인트론 경계 추정을 어렵게 만든다. 스플라이싱 후 남은 엑손(exon) 서열은 mRNA로 전환되고, 표준 유전 코드(61개의 코돈 → 20개의 아미노산) 를 이용해 단백질 서열로 번역된다.
키 구성은 두 부분으로 나뉜다. E1은 인트론 시작·패턴 코드와 인트론 위치 정보를 담고, E2는 코돈‑아미노산 매핑을 포함한다. 복호화 시에는 E2를 이용해 단백질을 mRNA로 역번역하고, E1을 사용해 원래 DNA 서열을 복원한다. 이 과정은 모두 선형 시간 O(n) 에 수행될 수 있어, 대용량 데이터에 대한 실용성을 확보한다.
보안 측면에서 저자는 무작위 대입(brute‑force) 공격에 대해 전체 검색 공간이 2ⁿ에 달한다고 주장한다. 이는 인트론 길이와 개수(k·m)가 전체 길이 n 의 일정 비율을 차지할 때, 가능한 DNA 복원 조합이 2ⁿ에 근접함을 수학적으로 추정한 결과이다. 그러나 실제 공격자는 선택 평문(Chosen‑Plaintext)이나 차분 공격(differential attack) 등을 통해 인트론 위치와 패턴, 심지어 코돈 매핑까지 추정할 가능성이 있다. 논문은 인트론을 다중 라운드로 겹치게 하거나, 중요한 데이터는 인트론 내부에 삽입하고 외부 암호화 체계와 결합하는 방안을 제시한다.
또한, 키 길이가 평문 길이에 비례한다는 점은 저장·전송 효율을 높이는 동시에, 키 관리 측면에서 전통적인 대칭키 방식보다 복잡성을 증가시킨다. 일회용 패드(One‑Time Pad)와 결합하면 키가 평문당 하나만 필요하므로, 키 재사용에 따른 취약점을 완전히 제거할 수 있다. 다만, 실제 구현 시 인트론 시작·패턴 코드의 선택이 부적절하면 인트론이 과도하게 짧아져 부분 평문이 그대로 노출되는 위험이 존재한다.
결론적으로, 이 방법은 DNA 생물학적 메커니즘을 소프트웨어 수준에서 재현함으로써, 기존 암호화 알고리즘에 비해 데이터 압축 및 전송 효율을 제공한다. 하지만 보안 강도는 전통적인 수학적 난이도 기반 암호에 비해 낮으며, 보조적인 보안 계층으로 활용하는 것이 현실적이다. 향후 연구에서는 다중 라운드, 가변 패턴, 그리고 양자 저항성을 고려한 변형이 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기