링형 폴리곤 주석을 위한 위상 보존 데이터 증강

본 논문은 건축 평면도와 같은 구조화된 이미지에서 내부 구멍을 가진 링형 영역을 하나의 순환 폴리곤 체인으로 표현할 때, 기존 기하학적 데이터 증강 과정에서 발생하는 정점 손실과 위상 파괴 문제를 해결한다. 마스크 공간에서 변환을 수행하고, 살아남은 정점을 인덱스 공간으로 투사해 순환 연결을 복원함으로써 사이클형 인접성(CAP)을 거의 완벽하게 유지한다는 실험 결과를 제시한다.

저자: Sudip Laudari, Sang Hun Baek

링형 폴리곤 주석을 위한 위상 보존 데이터 증강
본 논문은 건축 평면도와 같은 구조화된 비전 도메인에서 흔히 나타나는 ‘링형’ 영역, 즉 외부 경계와 내부 구멍을 하나의 순환 폴리곤 체인으로 표현하는 경우에 초점을 맞춘다. 기존의 데이터 증강 기법은 폴리곤 정점을 직접 변환하지만, 회전·스케일·크롭·플리핑 등에서 정점이 이미지 경계 밖으로 잘리면 정점이 사라지고, 특히 외부와 내부 경계를 연결하는 브리지 에지가 사라져 원래의 위상이 깨진다. 이러한 위상 파괴는 픽셀 레벨에서는 눈에 띄지 않지만, 주석 레벨에서 단일 영역이 여러 조각으로 분리되는 심각한 오류를 초래한다. 논문은 이 문제를 해결하기 위해 ‘순서 보존 연결 복구’라는 네 단계 파이프라인을 제안한다. 첫 단계에서는 원본 폴리곤 P=(p₁,…,pₙ)를 바이너리 마스크 M으로 래스터화한다. 두 번째 단계에서는 변환 T(회전, 스케일, 이동, 크롭 등)를 마스크에 적용해 변형된 마스크 M′=T(M)를 만든다. 세 번째 단계에서는 원본 정점의 인덱스를 유지하면서, 변형된 마스크 경계에서 가장 가까운 픽셀을 찾아 변환된 좌표 p′ᵢ 로 투사한다. 이때 이미지 밖으로 벗어난 정점은 삭제되고, 새로운 교차점이 필요하면 자동으로 추가한다. 네 번째 단계에서는 살아남은 정점 인덱스 집합 J=(k₁,…,k_m)를 원래 순환 순서대로 정렬하고, 연속 인덱스 관계(k_{t+1} = (k_t mod n)+1)를 검사한다. 만약 인덱스 간에 간격이 존재하면, 해당 구간을 직접 연결하는 방향성 에지(p′_{k_t}, p′_{k_{t+1}})를 삽입해 사이클을 복원한다. 이렇게 하면 원래의 외부 경계 B_out, 내부 경계 B_in, 그리고 브리지 에지 e_b와 클로저 에지 e_c가 모두 보존된 단일 순환 체인이 재구성된다. 알고리즘은 살아남은 정점 수 m에 비례하는 O(m) 시간 복잡도를 가지며, 기존 증강 연산에 비해 부가적인 연산량이 거의 없다는 장점이 있다. 또한, 컨투어 재추출에 의존하지 않으므로 해상도에 민감하지 않으며, 기존 Albumentations, imgaug, AugmenTory 등과 같은 폴리곤 기반 증강 라이브러리에 손쉽게 통합될 수 있다. 실험에서는 4가지 기본 변환(회전, 스케일, 크롭, 플리핑)과 이들의 복합 조합을 적용한 후, 기존 YOLOv11 파이프라인과 RoboFlow 증강을 베이스라인으로 삼아 CAP(Cyclic Adjacency Preservation) 지표를 측정했다. 결과는 제안 방법이 거의 100%에 달하는 CAP 점수를 기록한 반면, 기존 파이프라인은 브리지가 얇은 경우 70% 이하로 급락하는 현상을 보였다. 특히 복합 변환(회전+크롭) 상황에서도 제안 방법은 위상 손실 없이 정확히 연결을 복구했으며, 정밀한 구조 정보를 필요로 하는 레이아웃 분석, 공간 측정, 라스터‑투‑벡터 변환 등 downstream 작업에서 오류 전파를 방지한다는 점을 확인했다. 결론적으로, 이 연구는 폴리곤 주석의 위상 일관성을 보장하는 경량화된 복구 메커니즘을 제시함으로써, 구조화된 이미지 도메인에서 데이터 증강의 신뢰성을 크게 향상시킨다. 향후 연구에서는 다중 홀이 있는 복합 링형 구조나 비정형 다각형에 대한 확장, 그리고 위상 보존 손실 함수를 결합한 학습 기반 접근법을 탐색할 계획이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기