장기 연속 테스트 시계열 도메인 적응을 위한 적응형 균형 재초기화
초록
본 논문은 테스트 시점에 도메인이 지속적으로 변하는 상황에서 모델의 장기 성능 저하를 방지하기 위해 라벨 플립 변화를 신호로 활용한다. 라벨 플립이 급격히 상승할 때 가중치를 부분적으로 원본(source) 모델로 복원하고 현재 모델을 축소하는 “shrink‑restore” 방식을 적용해 적응형 재초기화(ABR)를 수행한다. 실험 결과, ABR은 기존 CTTA 방법들보다 긴 시간 동안 안정적인 정확도를 유지하며 특히 어려운 데이터셋에서 큰 성능 향상을 보인다.
상세 분석
본 연구는 장기 연속 테스트‑시간 도메인 적응(Long‑timescale CTT‑A)에서 발생하는 누적 오류 문제를 라벨 플립(label flip)이라는 지표로 포착한다. 라벨 플립은 현재 시점 모델과 직전 시점 모델이 예측한 클래스가 달라진 비율에 confidence 차이를 가중한 값으로 정의되며, 급격한 상승은 모델이 새로운 도메인에 과도하게 적응하면서 기존 지식을 손실하고 있음을 암시한다. 저자들은 라벨 플립의 원시값에 지수 이동 평균(α=0.5)을 적용해 노이즈를 억제하고, 전체 라벨 플립 궤적 중 최소값(LF_min)을 기준점으로 삼아 현재값과의 차이(ΔLF)와 시간 차이(Δt)를 이용해 기울기 S_t = ΔLF/Δt 를 계산한다. 이 기울기가 사전 설정된 임계값 β(=2e‑6)보다 크고, 안정 구간 길이의 제곱근으로 스케일링된 경우 재초기화를 트리거한다.
재초기화는 단순히 원본 가중치로 복원하는 것이 아니라, “shrink‑restore” 전략을 적용한다. 구체적으로 θ_t = λ_t·θ_source + (1‑λ_t)·θ_{t‑1} 로 업데이트하며, λ_t = LF_t / (LF_t + LF_min) 로 정의한다. 라벨 플립이 최소점에 비해 크게 상승하면 λ_t가 커져 원본 가중치 비중이 높아지고, 반대로 상승폭이 작으면 현재 모델의 가중치를 많이 보존한다. 이렇게 동적으로 균형을 맞춘 재초기화는 오류 누적을 억제하면서도 새로운 도메인에 대한 적응력을 유지한다.
실험에서는 ResNet‑50 기반 EA‑TTA 프레임워크 위에 ABR을 적용하고, CIN‑C, CIN‑3DCC, CCC 등 세 가지 대규모 벤치마크(각각 난이도 별 Easy/Medium/Hard)에서 기존 CTTA 방법들과 비교하였다. 표 1의 결과는 대부분의 기존 방법이 장기 적응 시 정확도가 급격히 떨어지거나 사전 학습 모델 수준 이하로 붕괴되는 반면, ABR은 평균 40.2%의 정확도로 가장 높은 성능을 기록한다. 특히 어려운 CCC‑Hard 환경에서 12.7% 포인트 상승을 보이며, RDumb(튜닝된 고정 인터벌)보다도 일관된 이득을 제공한다. 추가적인 Ablation 실험에서는 라벨 플립 기반 트리거 없이 무작위 시점에 재초기화하거나 고정 인터벌만 사용하는 경우 성능이 크게 저하됨을 확인하였다.
한계점으로는 라벨 플립 계산에 현재와 직전 모델의 전체 테스트 배치를 필요로 하며, 실시간 스트리밍 환경에서는 추가 연산 비용이 발생할 수 있다. 또한 β와 α와 같은 하이퍼파라미터가 모든 도메인에 동일하게 적용되었지만, 도메인 변동 속도가 매우 빠른 경우 재조정이 필요할 가능성이 있다. 향후 연구에서는 라벨 플립을 보다 경량화된 근사치로 대체하거나, 메타‑학습을 통해 트리거 기준을 자동 최적화하는 방안을 탐색할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기