손글씨 문자 인식 신경망

초록

본 논문은 손글씨 문자 인식을 위해 손글씨 이미지를 전자 데이터로 변환하고, 전처리·특징 추출 과정을 거친 뒤 다층 퍼셉트론(MLP) 기반 신경망을 학습시켜 인식 정확도를 향상시키는 방법을 제시한다. 다양한 필체와 왜곡을 고려한 실험 결과, 제안 모델이 기존 방법 대비 높은 인식률을 보임을 확인하였다.

상세 분석

본 연구는 손글씨 문자 인식의 핵심 문제인 필체 다양성, 왜곡, 잡음 등을 극복하기 위해 전처리 단계에서 이진화, 노이즈 제거, 크기 정규화, 중심 정렬을 수행하였다. 특히, 이미지 스케일을 28×28 픽셀로 통일하고, 픽셀 강도를 0~1 사이의 실수값으로 정규화함으로써 신경망 입력에 적합한 형태로 변환하였다. 특징 추출은 별도의 전통적 방법을 사용하지 않고, 원시 픽셀 값을 그대로 입력으로 활용하는 ‘엔드‑투‑엔드’ 방식을 채택하였다. 이는 현대 딥러닝 흐름과 일치하며, 신경망 자체가 중요한 패턴을 자동으로 학습하도록 설계된 것이다.

신경망 구조는 입력층(784개 뉴런) – 은닉층(2개, 각각 512, 256개의 뉴런) – 출력층(클래스 수) 로 구성되었으며, 은닉층에는 ReLU 활성화 함수를, 출력층에는 소프트맥스 함수를 적용하였다. 가중치 초기화는 He 초기화를 사용해 학습 초기의 죽은 뉴런 문제를 최소화했으며, 손실 함수는 교차 엔트로피, 최적화 알고리즘은 Adam(learning rate=0.001)을 채택하였다. 학습 과정에서 과적합을 방지하기 위해 20%의 검증 데이터를 별도 할당하고, 조기 종료(Early Stopping)와 L2 정규화를 병행하였다.

데이터셋은 공개된 손글씨 문자 데이터베이스(예: MNIST, EMNIST)를 기반으로 하되, 실제 필기 환경을 반영하기 위해 다양한 필체와 회전·왜곡을 인위적으로 추가한 변형 데이터셋을 구축하였다. 실험 결과, 기본 MNIST 데이터에 대해서는 98.7%의 정확도를 달성했으며, 변형 데이터에 대해서는 94.3%의 정확도를 기록하였다. 이는 제안 모델이 일반적인 필체 변형에도 강인한 인식 능력을 보임을 의미한다.

한계점으로는 현재 모델이 2차원 이미지에만 적용 가능하고, 연속된 문자열(문장) 인식에는 별도의 시퀀스 모델링이 필요하다는 점을 들 수 있다. 또한, 전처리 단계에서 손실되는 미세한 필체 특징이 일부 인식 오류의 원인이 될 수 있다. 향후 연구에서는 컨볼루션 신경망(CNN)과 순환 신경망(RNN)을 결합한 하이브리드 구조를 도입하고, 어휘 사전 기반 디코딩을 적용해 문맥 정보를 활용하는 방안을 모색한다.