고정밀 에지 검출을 위한 텍스처 적응 구조와 이상 사전 가이드

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 초고해상도(SR)에서 영감을 얻은 Cascaded Skipping Density Block(CSDB)을 기반으로 한 경량 에지 검출 모델 SDPED를 제안한다. 텍스처와 에지를 구분하도록 구조를 재설계하고, 인간 주석의 잡음을 완화하기 위해 무노이즈 라벨을 이상 사전으로 활용하는 데이터 증강 방식을 도입한다. 또한 픽셀 단위 고정 오차 기준을 적용해 해상도에 무관한 엄격한 평가 프로토콜을 제시한다. 네 개의 벤치마크(BRIND, UDED, MDBD, BIPED2)에서 평균 정밀도(AP) 기준으로 최대 22.5%까지 성능 향상을 입증한다.

상세 분석

SDPED의 핵심은 기존 초고해상도 복합밀도 블록(Dense Block)을 에지 검출에 맞게 변형한 CSDB이다. Dense Block은 텍스처 복원에 강점을 보이지만, 에지 검출에서는 과도한 특징 혼합으로 미세 경계가 흐려지는 문제가 있었다. 저자들은 “스키핑” 메커니즘을 도입해 각 블록 사이에 직접적인 피처 전달을 유지하면서도, 레이어 간의 불필요한 중복을 최소화하였다. 이로써 고주파 텍스처는 억제하고, 실제 경계는 정밀하게 보존한다. 또한, 기존 ED 모델이 다중 스케일 손실에 의존하는 반면, SDPED는 1×1 컨볼루션만으로는 부족한 정보를 보강하기 위해 3×3 컨볼루션 2개와 Leaky ReLU를 포함한 전용 피처 융합 블록을 삽입하였다. 파라미터 수는 1.2M 수준으로 경량화되었으며, 연산량도 기존 BDCN 대비 30% 이하로 감소한다.

학습 측면에서는 “이상 사전(Guidance)” 전략을 도입한다. 인간이 그린 라벨은 주관적 오류와 잡음이 내재되어 있어, 모델이 완벽한 경계를 학습하기 어렵다. 저자들은 원본 라벨을 “노이즈 없는 샘플”로 간주하고, 이를 입력 이미지와 동일한 형태로 변형한 뒤, 기존 데이터와 함께 혼합한다. 이 과정에서 라벨 자체를 데이터로 활용함으로써, 모델이 이상적인 에지 분포를 직접 경험하게 만든다. 결과적으로, 노이즈가 없는 라벨을 입력했을 때 SDPED는 거의 완벽에 가까운 출력(정밀도 99.8%)을 보이며, 일반 이미지에서도 텍스처와 경계 구분 능력이 크게 향상된다.

평가 프로토콜도 중요한 기여이다. 기존 ODS/OIS는 이미지 대각선 길이에 비례한 maxDist(예: 0.0075)로 허용 오차를 정의했는데, 이는 해상도에 따라 실제 픽셀 오차가 크게 달라진다. 저자들은 고정 픽셀(예: 2px) 기준을 제안해, 모든 데이터셋에서 동일한 위치 정확성을 측정한다. 이 엄격한 기준 하에서 SDPED는 특히 AP 지표에서 기존 최첨단 모델(HED, RCF, BDCN 등)을 크게 앞선다.

종합하면, 텍스처 처리에 특화된 구조를 에지 검출에 맞게 재설계하고, 라벨 노이즈를 근본적으로 감소시키는 학습 전략과 해상도 독립적인 평가 방식을 동시에 도입함으로써, 고정밀 에지 검출 분야에 새로운 패러다임을 제시한다.

고정밀 에지 검출을 위한 텍스처 적응 구조와 이상 사전 가이드

초록

상세 분석

댓글 및 학술 토론

의견 남기기