도메인 기반 스케치 인식 시스템

본 논문은 이미지 처리 전문가가 아니어도 UI 디자이너와 도메인 전문가가 손쉽게 스케치 인식 시스템을 구축할 수 있도록, 마우스로 그린 거친 스케치를 세그멘테이션과 도메인 분류를 통해 자동으로 인식하고, 해당 도메인·도형·속성을 반환하며 부드럽게 재구성하는 프레임워크를 제안한다.

도메인 기반 스케치 인식 시스템

초록

본 논문은 이미지 처리 전문가가 아니어도 UI 디자이너와 도메인 전문가가 손쉽게 스케치 인식 시스템을 구축할 수 있도록, 마우스로 그린 거친 스케치를 세그멘테이션과 도메인 분류를 통해 자동으로 인식하고, 해당 도메인·도형·속성을 반환하며 부드럽게 재구성하는 프레임워크를 제안한다.

상세 요약

이 연구는 스케치 인식 파이프라인을 크게 네 단계로 나눈다. 첫 번째 단계는 입력된 자유형 스케치를 벡터화하고, 연속적인 점들의 곡선을 일정 길이의 세그먼트로 분할하는 전처리 과정이다. 여기서는 기존의 Douglas‑Peucker 알고리즘을 변형해, 스케치의 급격한 방향 변화와 속도 정보를 동시에 고려함으로써 과도한 세그먼트 생성을 억제하고, 인간이 인식하는 ‘핸드 라인’의 핵심 구조를 보존한다. 두 번째 단계는 각 세그먼트에 기하학적 특징(길이, 방향, 곡률, 시작·끝 좌표 등)을 추출하고, 이를 기반으로 히스토리 기반 휴리스틱 매칭을 수행한다. 논문은 도메인 별 ‘템플릿 집합’을 사전 정의하고, 각 템플릿은 다중 레벨 특징 트리를 갖는다고 설명한다. 매칭 과정에서는 특징 벡터 간 유클리드 거리와 방향 일치도를 가중합해 비용 함수를 만들고, 최소 비용 매칭을 통해 가장 유사한 도형을 후보로 선정한다.

세 번째 단계는 도메인 분류이다. 저자는 다중 클래스 SVM 대신, 도메인 간 상호 배타성을 활용한 계층적 규칙 기반 분류기를 설계했다. 각 도메인은 고유한 속성 집합(예: 전기 회로는 전선·저항·전원, 건축은 벽·문·창)과 관계 규칙(연결성, 포함 관계 등)을 메타데이터로 보유한다. 세그먼트 매칭 결과가 해당 도메인의 규칙을 만족하면, 해당 도메인으로 확정하고, 불일치 시 하위 도메인 혹은 ‘기타’로 전이한다. 이 접근법은 학습 데이터가 부족한 상황에서도 높은 정확도를 유지한다는 장점이 있다.

마지막 단계는 인식 결과를 시각적으로 재구성하는 ‘스무딩 렌더링’이다. 선택된 도형의 기하학적 파라미터를 기반으로 베지어 곡선 혹은 스플라인을 재생성하고, 원본 스케치와 겹쳐 보여줌으로써 사용자는 자신의 의도를 시스템이 올바르게 해석했는지 즉시 확인할 수 있다.

실험 결과는 5개의 서로 다른 도메인(전기 회로, UML 다이어그램, 건축 평면도, 화학 구조식, 일반 기하 도형)에서 평균 인식 정확도가 92%에 달했으며, 특히 도메인 전환이 빈번한 복합 스케치에서 기존 CNN 기반 방법보다 8% 높은 성능을 보였다. 또한, 비전문가 사용자를 대상으로 한 사용자 연구에서 평균 작업 시간 감소율이 35%에 이르는 등 실용성도 입증되었다.

이 논문의 핵심 기여는 (1) 도메인 별 템플릿과 규칙을 활용한 휴리스틱 매칭 프레임워크, (2) 규칙 기반 계층적 도메인 분류기, (3) 스케치 입력의 불완전성을 보완하는 부드러운 재구성 기법이다. 다만, 템플릿 정의와 규칙 설계가 도메인 전문가의 사전 작업을 필요로 하며, 새로운 도메인 추가 시 초기 구축 비용이 존재한다는 한계점이 있다. 향후 연구에서는 자동 템플릿 학습과 규칙 추출을 위한 메타러닝 기법을 도입해, 시스템의 확장성을 더욱 강화할 수 있을 것으로 기대된다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...