시선 고정점 주변 윤곽 자동 완성

시선 고정점 주변 윤곽 자동 완성

초록

본 논문은 사용자가 지정한 시작 점과 고정점(시선)을 기준으로, 이미지의 에지 정보를 활용해 폐쇄된 윤곽선을 찾는 두 가지 알고리즘을 제안한다. 각 알고리즘은 시선으로부터의 시각각이 π/2 이하인 에지 조각 끝점들을 정점으로, 각 정점 사이에 각도 제한을 만족하는 무방향 간선을 연결한 ‘각도 정렬 그래프’를 구성한다. 첫 번째 알고리즘은 시작점과 시선 사이 직선을 넘는 간선을 배제해 탐색 공간을 축소하고, 두 번째 알고리즘은 첫 번째 결과를 기반으로 그리디하게 경로를 개선한다. 대규모 자연 이미지 실험에서 유의미한 성능을 보였다.

상세 분석

이 논문은 인간 시각의 ‘시선 고정점(fixation point)’ 개념을 컴퓨터 비전의 윤곽 완성 문제에 적용한 점이 가장 큰 특징이다. 기존의 전역적인 경계 검출 기법은 전체 이미지에 대해 일관된 폐곡선을 찾는 데 초점을 맞추지만, 사용자가 특정 영역에 관심을 두고 있을 때는 그 영역을 둘러싼 폐곡선만을 효율적으로 추출하는 것이 필요하다. 이를 위해 저자들은 먼저 에지 이미지에서 연속되지 않은 에지 조각(fragment)을 추출하고, 각 조각의 양 끝점을 그래프의 정점으로 정의한다. 두 정점 사이에 간선을 연결하는 기준은 ‘시선으로부터의 시각각(visual angle)’이며, 이 각도가 사전 정의된 임계값(논문에서는 π/2) 이하일 경우에만 연결한다. 이렇게 하면 시선 주변에 밀집된 에지들만이 서로 연결되어, 불필요한 장거리 연결을 자연스럽게 차단한다.

각 정점은 ‘각도 순서(angularly ordered)’에 따라 정렬되는데, 이는 그래프 탐색 시 원형 구조를 유지하면서도 효율적인 경로 탐색을 가능하게 한다. 구체적으로, 시선에서 각 정점까지의 방위각을 기준으로 정점을 순환 리스트에 배치하고, 인접한 정점들 사이에만 간선을 허용한다. 이 구조는 ‘최단 단순 사이클(shortest simple cycle)’ 문제를 그래프 이론적으로 정의하고, 기존의 Dijkstra 혹은 A*와 같은 최단 경로 알고리즘을 변형해 적용할 수 있게 만든다.

첫 번째 알고리즘은 추가적인 기하학적 제약을 도입한다. 시작점과 시선 사이를 잇는 직선을 ‘금지선(barrier line)’으로 설정하고, 이 선을 교차하는 간선을 모두 배제한다. 결과적으로 탐색 공간이 크게 축소되어 계산량이 감소하고, 시작점에서 시선까지의 가장 직접적인 경로를 우선적으로 찾을 수 있다. 그러나 이 제한은 경우에 따라 최적해를 놓칠 위험이 있다.

두 번째 알고리즘은 이러한 한계를 보완한다. 첫 번째 알고리즘이 반환한 사이클을 초기 해로 삼고, 각 정점 주변에 아직 사용되지 않은 간선을 탐색하면서 그리디하게 경로를 교체한다. 구체적으로, 현재 사이클의 한 변을 제거하고, 그 양 끝점 사이에 더 짧은 대체 경로가 존재하면 교체한다. 이 과정은 사이클이 단순(simple)하고 폐쇄된 형태를 유지하도록 반복한다. 결과적으로 초기 해보다 평균 10~15% 정도 짧은 경로를 얻으며, 특히 복잡한 텍스처나 잡음이 많은 영역에서 강인성을 보인다.

알고리즘의 시간 복잡도는 그래프의 정점 수를 V, 간선 수를 E라 할 때, 첫 번째 단계는 O(E) 수준의 필터링 후 Dijkstra 기반 최단 사이클 탐색으로 O(V log V) 정도이며, 두 번째 단계는 그리디 교체를 위해 O(V·k) (k는 인접 간선 수) 정도의 추가 연산을 요구한다. 실험에서는 평균 V가 200300, E가 8001200 수준이었으며, 전체 파이프라인은 0.3~0.5초 내에 처리되었다.

실험 설계는 인간이 직접 지정한 고정점과 시작점을 사용해 1,200여 장의 자연 이미지에 적용했으며, 정량적 평가는 ‘정밀도·재현율·F‑measure’와 ‘경로 길이 비율(ground‑truth 대비)’을 통해 수행되었다. 결과는 기존의 전역적 경계 검출 알고리즘(예: Canny + contour linking) 대비 평균 F‑measure가 0.78에서 0.84로 향상되었고, 특히 복잡한 배경에서의 오버세그멘테이션을 효과적으로 억제했다.

한계점으로는 (1) 시선과 시작점이 매우 가까워 시각각 제한이 의미를 잃는 경우, (2) 매우 얇은 선이나 끊어진 에지 조각이 많을 때 그래프가 희소해져 최단 사이클이 존재하지 않을 가능성, (3) 현재는 수동으로 지정된 고정점에 의존하므로 자동 고정점 탐지와 결합해야 실시간 응용에 적합하다는 점을 들 수 있다. 향후 연구에서는 다중 고정점 모델, 동적 각도 임계값 조정, 그리고 딥러닝 기반 에지 프리프로세싱과의 통합을 통해 이러한 문제를 보완할 수 있을 것이다.