유연한 행 구분을 위한 새로운 방법
초록
**
본 논문은 손글씨 이미지에서 행을 나누는 기존 방식이 겪는 고립 문자 연장 절단 문제를 해결하기 위해, 가변적인 경계(플렉시블 프론티어)를 적용한 새로운 분할 알고리즘을 제안한다. 제안 기법은 문자 형태와 기울기를 고려해 동적으로 경계를 설정함으로써, 문자 손실을 최소화하고 최종 인식 단계에서 오류율을 현저히 낮춘다.
**
상세 분석
**
이 연구는 손글씨 문서의 행 구분 과정에서 발생하는 두 가지 핵심 문제, 즉 ‘고립 문자 연장(amputation)’과 ‘행 경계의 경직성’을 동시에 해결하고자 한다. 기존의 고정된 행 경계 방식은 문자들이 서로 겹치거나 기울어져 있을 때, 특히 위·아래로 뻗어 있는 획이 다른 행에 침범하는 경우 해당 획을 잘라내는 부작용을 일으킨다. 이러한 절단은 OCR(Optical Character Recognition) 단계에서 문자 인식 오류를 급격히 증가시킨다.
제안된 ‘유연한 프론티어(Flexible Frontier)’는 이미지 전처리 단계에서 각 픽셀의 기울기와 연속성을 분석하여, 행 경계를 하나의 연속적인 곡선이 아니라 다중 샘플 포인트들의 집합으로 모델링한다. 구체적으로, 먼저 전역적인 스케일링과 노이즈 제거를 위해 가우시안 블러와 이진화 과정을 수행한다. 이후, 수직 방향의 프로젝션 히스토그램을 기반으로 초기 행 후보를 추출하고, 각 후보 영역에 대해 Sobel 연산자를 이용해 수직·수평 기울기 맵을 만든다.
핵심 단계는 ‘동적 경계 최적화(Dynamic Boundary Optimization)’이다. 여기서는 각 행 후보 내부의 픽셀을 그래프 노드로, 인접 픽셀 간의 유사성을 에지 가중치로 설정한 뒤, 최소 비용 경로 알고리즘(예: Dijkstra 또는 A* 탐색)을 적용해 행 경계가 최소한의 문자 손실을 초래하도록 경로를 찾는다. 이때, 손실 비용은 (1) 문자 획이 경계와 교차하는 횟수, (2) 경계가 지나가는 영역의 픽셀 밀도, (3) 기울기 변화량을 종합한 가중치 함수로 정의된다.
또한, 경계가 결정된 후에는 ‘연결성 보정(Connectivity Restoration)’ 단계에서 잘려나간 문자 부분을 복원한다. 이를 위해, 경계 주변의 연결 성분 분석을 수행하고, 분리된 획이 기존 문자와 연결될 가능성이 높은 경우, 해당 획을 원래 위치로 재배치한다. 이 과정은 마스크 기반의 형태학적 연산과 템플릿 매칭을 결합해 구현한다.
실험 결과, 제안 알고리즘은 IAM Handwriting Database와 자체 수집한 다국어 손글씨 데이터셋에서 기존 고정 경계 방식 대비 평균 12% 이상의 인식 오류 감소를 보였다. 특히, 기울기가 큰 서체나, 행 간 간격이 불균일한 경우에 그 효과가 두드러졌다. 또한, 연산 복잡도는 O(N·log N) 수준으로, 실시간 처리 요구를 만족한다.
이 논문의 주요 기여는 (1) 행 경계를 동적으로 최적화하는 프레임워크 제시, (2) 문자 손실을 최소화하는 비용 함수 설계, (3) 경계 후 복원 메커니즘을 통한 인식 정확도 향상이다. 이러한 접근은 기존 OCR 파이프라인에 손쉽게 통합될 수 있으며, 특히 문서 디지털화, 고전 서적 보존, 필기 입력 시스템 등 다양한 응용 분야에 적용 가능성을 제시한다.
**