여백 주석 자동 제거 및 원본 복원 기술

여백 주석 자동 제거 및 원본 복원 기술

초록

본 논문은 인쇄된 문서에 손으로 적힌 여백 주석을 자동으로 탐지·제거하고, 손실된 인쇄 텍스트를 복원하는 두 단계 알고리즘을 제안한다. 수평·수직 투영 프로파일을 이용해 대략적인 여백 경계를 찾은 뒤, 연결 요소 분석을 통해 경계 내에서 잘려나간 텍스트를 복구한다. 50장의 복합 주석 문서 실험에서 주석 제거 정확도 89.01%, 원본 복원 정확도 97.74%를 달성하였다.

상세 분석

이 연구는 인쇄 문서에 손으로 추가된 여백 주석을 원본 문서와 분리하는 문제에 초점을 맞춘다. 기존 연구들은 전체 페이지에서 주석을 식별하거나, OCR 기반의 텍스트와 주석을 구분하려 했지만, 여백에 국한된 주석은 경계가 불명확하고 인쇄 텍스트와 겹치는 경우가 많아 높은 오류율을 보였다. 논문은 이를 해결하기 위해 두 단계의 파이프라인을 설계하였다. 첫 번째 단계에서는 수평 및 수직 투영 프로파일을 계산해 페이지의 여백 영역을 추정한다. 구체적으로, 각 행·열의 픽셀 밀도를 구해 급격히 감소하는 지점을 경계 후보로 선정하고, 일정 임계값 이하인 구간을 여백으로 정의한다. 이 과정은 빠르고 구현이 간단하지만, 경계가 정확하지 않아 여백에 인접한 인쇄 문자까지 잘려나갈 위험이 있다. 이를 보완하기 위해 두 번째 단계에서는 이진화된 이미지에서 연결 요소(Connected Component)를 추출하고, 각 요소의 위치, 크기, 종횡비 등을 분석한다. 경계 밖에 위치한 요소이면서 여백 경계와 인접한 경우, 특히 높이·폭이 인쇄 문자와 유사한 경우를 “잘려진 텍스트”로 판단한다. 그런 요소들은 원본 이미지에서 해당 좌표를 복원하거나, 주변 픽셀 정보를 이용해 보간한다. 또한, 손글씨와 인쇄 문자 간의 평균 픽셀 강도 차이를 활용해 오분류를 최소화한다. 실험에서는 50장의 실제 문서(다양한 필기 스타일·크기·색상 포함)를 수집해, 주석 제거율과 복원 정확도를 각각 89.01%와 97.74%로 측정하였다. 정량적 평가는 주석 영역과 복원된 텍스트 영역의 교집합 비율(IoU)과 문자 인식 정확도(F1-score)를 사용했다. 결과는 제안 알고리즘이 여백 주석을 효과적으로 제거하면서도 인쇄 텍스트 손실을 거의 복구함을 보여준다. 한계점으로는 매우 복잡한 레이아웃(다중 컬럼·표·그림 포함)이나, 주석이 인쇄 텍스트와 완전히 겹치는 경우 복원률이 떨어진다는 점을 언급한다. 향후 연구에서는 딥러닝 기반의 세분화 모델을 도입해 경계 검출을 정밀화하고, 다중 레이아웃 문서에 대한 일반화를 목표로 할 수 있다.