아랍어 손글씨 우편 주소 인식을 위한 새로운 접근법

초록

본 논문은 베타 타원 모델을 활용한 아랍어 손글씨 우편 주소 자동 인식 시스템을 제안한다. 이미지 필터링, 경계 제거, 주소 위치 탐지 및 분할 과정을 거쳐 우편번호와 도시명을 별도로 추출한다. 손글씨 궤적의 시간 순서를 복원한 뒤 베타‑타원 모델로 특징을 표현하고, 그래프 매칭 알고리즘으로 인식한다. 튀니지 우편물 데이터셋을 이용한 실험에서 98%의 인식률을 달성하였다.

상세 분석

이 연구는 아랍어와 같이 연결형 문자 체계를 가진 언어의 손글씨 인식에 특화된 파이프라인을 설계했다는 점에서 의미가 크다. 먼저 이미지 전처리 단계에서 잡음 제거와 함께 봉투의 테두리, 스탬프, 그래픽 요소를 자동으로 식별·제거하는 알고리즘을 적용했는데, 이는 실제 우편물에서 흔히 발생하는 복합 배경을 정제하는 데 필수적이다. 주소 영역을 찾는 과정은 색상·형태 기반의 영역 분할 기법을 사용했으며, 이후 주소와 우편번호·도시명을 분리하는 세분화 단계는 라인·워드 레벨의 구조적 정보를 활용한다.

핵심 기술은 ‘베타‑타원 모델’이다. 손글씨 궤적을 시간 순서대로 재구성한 뒤, 각 스트로크를 베타 함수와 타원 형태의 파라미터로 근사한다. 베타 함수는 스트로크의 속도와 가속도를, 타원은 곡선의 기하학적 형태를 효과적으로 캡처한다. 이러한 파라미터 집합은 기존의 픽셀 기반 특징보다 차원 축소와 노이즈 강인성을 동시에 제공한다. 특히 아랍어는 문자 내부에 많은 곡선과 연결 구조가 존재하므로, 타원형 파라미터가 문자 형태를 정밀히 표현하는 데 유리하다.

인식 단계에서는 그래프 매칭 알고리즘을 적용한다. 각 문자(또는 서브스트로크)를 노드로, 인접 관계를 엣지로 하는 그래프를 구성하고, 사전 정의된 베타‑타원 파라미터와의 유사도 매트릭스를 기반으로 최적 매칭을 수행한다. 이 접근법은 전통적인 HMM·CNN 기반 방법보다 구조적 일관성을 보존하면서도 변형에 강인한 매칭을 가능하게 한다. 실험 결과는 튀니지 우편물 데이터셋(다양한 필체와 잡음 포함)에서 평균 98%의 인식률을 기록했으며, 특히 우편번호와 도시명 구분에서 높은 정확도를 보였다.

하지만 몇 가지 한계도 존재한다. 베타‑타원 모델 파라미터 추정은 초기 궤적 복원에 크게 의존하는데, 이미지 해상도가 낮거나 강한 왜곡이 있을 경우 복원 오류가 누적될 위험이 있다. 또한 그래프 매칭은 계산 복잡도가 O(n³) 수준으로, 대규모 실시간 시스템에 적용하려면 효율화가 필요하다. 향후 연구에서는 딥러닝 기반 전처리와 병렬 그래프 매칭 기법을 결합해 처리 속도를 개선하고, 다국어(예: 페르시아어, 우르두어) 확장성을 검증할 수 있을 것이다.