두 매체를 이용한 텍스트 스테가노그래피
초록
본 논문은 비밀 텍스트를 파간람 문자열과 무압축 이미지 두 매체에 분산 저장하는 스테가노그래피 방식을 제안한다. 파간람에서 문자 위치를 시드와 오프셋으로 찾고, 이 2개의 인덱스를 이미지의 각 픽셀 RGB 채널 LSB 3비트에 삽입한다. 수신자는 동일 파간람과 이미지를 이용해 시드·오프셋을 복원하고 원문을 재구성한다. 두 매체를 동시에 사용함으로써 단일 매체 기반 공격에 대한 저항성을 높인다.
상세 분석
제안된 방법은 스테가노그래피의 기본 전제인 “숨김이 눈에 띄지 않아야 한다”는 목표를 두 매체를 활용함으로써 새로운 차원으로 확장한다. 첫 번째 매체인 파간람(Pangram)은 알파벳 전 문자와 공백, 구두점을 포함한 충분히 긴 문자열을 의미한다. 이 문자열은 사전에 정의된 고정 길이(예: 512자) 혹은 동적으로 생성될 수 있으며, 비밀 메시지의 각 문자에 대해 파간람 내에서 첫 번째 등장 위치를 찾는다. 검색은 무작위 시드(seed) 인덱스에서 시작해 순차적으로 진행되며, 목표 문자를 만나면 현재 인덱스와 시드 인덱스 사이의 거리(offset)를 계산한다. 시드와 오프셋은 각각 9비트(0~511) 범위 내에 제한될 수 있어, 두 값은 18비트 정보를 제공한다.
두 번째 매체는 무압축 비트맵 이미지이다. 각 픽셀은 24비트(R, G, B) 색상 정보를 갖고, 그 중 LSB 3비트씩을 사용해 시드와 오프셋을 저장한다. 구체적으로, 한 픽셀의 R, G, B 채널 각각의 LSB 3비트를 차례대로 시드 비트 02, 35, 6~8에 매핑하고, 다음 픽셀에 오프셋을 동일 방식으로 삽입한다. 이렇게 하면 한 문자당 두 픽셀(총 48비트)만을 사용하게 되며, 이미지의 시각적 품질 저하는 거의 감지되지 않는다. 또한, LSB 3비트만을 활용함으로써 색상 변형이 최소화되고, 일반적인 이미지 압축이나 재인코딩 과정에서도 데이터 손실 위험이 낮다.
보안 측면에서 가장 큰 강점은 “다중 매체 의존성”이다. 기존 스테가노그래피는 하나의 파일(이미지, 오디오, 비디오 등)에 비밀 데이터를 숨겨 공격자가 해당 파일만 분석하면 복구가 가능하다. 그러나 본 방법은 파간람과 이미지가 동시에 존재해야만 복호화가 가능하므로, 공격자는 두 파일을 모두 확보하고 정확히 매칭시켜야 한다. 파간람 자체가 일반 텍스트이기 때문에 파일 형식 탐지 도구에 의해 쉽게 식별되지 않으며, 이미지 파일도 일반적인 사진과 구별이 어려워 스텔스 효과가 강화된다. 또한, 시드가 무작위로 선택되므로 동일한 비밀 문자라도 매번 다른 시드·오프셋 쌍이 생성돼 통계적 패턴 분석을 방해한다.
알고리즘 복잡도는 문자당 O(L) 탐색(L은 파간람 길이)과 O(1) 이미지 삽입으로 구성된다. 파간람이 충분히 길면 평균 탐색 횟수는 절반 정도가 되며, 전체 비밀 메시지 길이에 비례하는 선형 시간 복잡도를 가진다. 메모리 사용량도 파간람 문자열과 이미지 버퍼만 필요하므로, 일반적인 PC 환경에서 실시간 인코딩·디코딩이 가능하다.
한계점으로는 파간람이 사전에 공유되어야 한다는 전제와, 파간람이 손상되면 복호화가 불가능하다는 점이다. 또한, 이미지의 용량이 비밀 메시지 길이에 비례해 커져야 하므로 대용량 텍스트를 숨기려면 고해상도 이미지가 필요하다. 이러한 제약은 키 교환 프로토콜이나 파간람을 동적으로 생성·전송하는 보완 메커니즘을 통해 완화될 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기