3D 의료 영상 분할을 위한 자동 네트워크 설계 SegNAS3D
SegNAS3D는 3차원 뇌 MRI 분할을 목표로, 블록을 유향 비순환 그래프로 표현하고 파라미터를 연속적으로 완화한 뒤 파생‑없는 전역 최적화(CRS)를 적용해 네트워크 구조와 하이퍼파라미터를 동시에 탐색한다. 43개의 데이터셋에서 평균 Dice 82%를 달성했으며, 탐색 시간은 3대 GPU에서 3일 이내, 모델 크기는 기존 V‑Net보다 현저히 작다.
저자: Ken C. L. Wong, Mehdi Moradi
본 논문은 3차원 의료 영상 분할을 위한 자동 네트워크 설계 프레임워크 SegNAS3D를 제안한다. 기존 딥러닝 기반 분할 방법은 네트워크 구조와 하이퍼파라미터를 수작업으로 설계해야 하는 부담이 있었으며, NAS 연구는 주로 2D 이미지 분류에 집중돼 3D 분할에 적용하기엔 연산·메모리 비용이 크게 증가한다는 문제점이 있었다. 이를 해결하기 위해 저자들은 두 가지 핵심 설계를 도입한다.
첫 번째 설계는 네트워크를 반복적인 ‘블록’ 단위로 구성하고, 각 블록을 유향 비순환 그래프(DAG) 형태의 상삼각 행렬로 표현한다는 것이다. 행렬의 행·열은 블록 내 노드를 의미하고, 비제로 원소는 사전에 정의된 연산(1×1, 3×3, 5×5 컨볼루션, 팽창(dilation) 포함, 스킵 연결 등)의 인덱스를 나타낸다. 블록 내 노드 수 자체도 학습 가능한 정수 하이퍼파라미터이며, 블록 간 연결(채널 수, 풀링·업샘플링 단계, 깊은 감독 사용 여부, 블록 잔차 연결) 역시 별도의 하이퍼파라미터로 모델링한다. 이렇게 하면 블록 내부와 블록 간 연결을 동시에 탐색하면서도, 전체 네트워크는 U‑Net·V‑Net과 유사한 인코더‑디코더 구조를 유지한다.
두 번째 설계는 하이퍼파라미터 공간을 연속적으로 완화(continuous relaxation)하여 정수 제약을 없애고, 파생‑없는 전역 최적화 알고리즘인 Controlled Random Search(CRS)를 적용한다는 점이다. CRS는 초기 샘플을 무작위로 생성하고, Nelder‑Mead와 유사한 변형을 통해 300번의 반복 안에 목표 함수를 최소화한다. 목표 함수는 검증 Dice의 음의 로그(−ln(Dice))이며, OOM 오류나 불법 블록 구조가 발생하면 큰 페널티 값(10⁴)으로 대체한다. 파생을 계산하지 않음으로써 비학습 가능한 상황을 손쉽게 처리하고, 연속 탐색 공간을 효율적으로 샘플링한다.
실험은 43개의 3D T1‑weighted MRI 데이터를 사용했으며, 각 이미지에는 19개의 해부학적 라벨이 있다. 데이터를 3가지 무작위 분할(50% 학습, 20% 검증, 30% 테스트)으로 나누어, 각 분할마다 세 가지 변형의 SegNAS3D를 실행했다. SegNAS‑11은 블록 구조와 블록 연결 파라미터 모두를 최적화(총 11개 파라미터)했으며 평균 Dice 81.7%와 9.7M 파라미터를 기록했다. SegNAS‑4는 블록 연결만(4개 파라미터) 최적화했으며 평균 Dice 81.0%와 3.2M 파라미터, 가장 짧은 GPU‑day(≈3일)로 가장 효율적인 결과를 얻었다. SegNAS‑7은 블록 구조만(7개 파라미터) 최적화했지만 평균 Dice 77.7%와 30.1M 파라미터로 가장 낮은 성능을 보였다. 기존 3D U‑Net은 메모리 초과(OOM)로 학습이 불가능했고, V‑Net은 71.1% Dice와 71M 파라미터를 기록했다.
결과 분석에서는 다음과 같은 인사이트를 도출한다. (1) 블록 내부를 DAG 형태로 자유롭게 설계하면서 연속 완화를 통해 파생‑없는 전역 탐색을 적용하면, 3D 의료 영상에서도 실용적인 NAS가 가능하다. (2) 하이퍼파라미터 공간을 적절히 제한하고 OOM 오류를 목표 함수에 페널티로 반영하면, 메모리 제한을 사전에 회피하면서도 경량 모델을 자동으로 도출할 수 있다. (3) 블록 연결 파라미터(n, p, sup, res)만 최적화해도 V‑Net 대비 4배 작은 모델으로 유사한 성능을 얻을 수 있어, 데이터가 제한된 의료 환경에서 과적합을 방지하고 빠른 프로토타이핑이 가능하다. (4) 블록 구조 자체를 최적화하면 정확도 향상이 가능하지만, 탐색 비용과 모델 크기가 증가하므로 실제 적용 시에는 목적에 맞는 파라미터 조합을 선택해야 한다.
결론적으로 SegNAS3D는 3D 의료 영상 분할에 특화된 NAS 프레임워크로, 파생‑없는 전역 최적화와 DAG 기반 블록 설계를 결합해 높은 정확도와 경량 모델을 동시에 달성한다. 향후 연구에서는 더 큰 데이터셋, 다양한 해부학적 영역, 그리고 멀티‑모달 입력을 포함한 확장이 기대된다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기