배경 분포 변화에서도 작동하는 개방형 도메인 적응: 도전과 효율적 해결책

배경 분포 변화에서도 작동하는 개방형 도메인 적응: 도전과 효율적 해결책

초록

본 논문은 기존 연구가 고정된 배경 분포를 전제로 하는 반면, 실제 환경에서는 알려진 클래스의 분포가 변할 수 있음을 지적한다. 이를 해결하기 위해 제안된 CoLOR는 새로운 클래스와 기존 클래스가 분리 가능하다는 완만한 가정 하에, 배경 분포가 변해도 개방형 인식을 보장한다. 이론적 분석과 과잉 파라미터화된 단순 모델에서의 성능 상한을 증명하고, 이미지·텍스트 데이터에 대한 대규모 실험을 통해 기존 방법들을 크게 앞선다.

상세 분석

본 연구는 ‘배경 분포 변화(Background Distribution Shift)’라는 새로운 문제 정의를 도입한다. 전통적인 개방형 인식(open‑set recognition)에서는 훈련 시점에 알려진 클래스들의 확률 분포가 고정된다고 가정하고, 테스트 시에만 새로운(unknown) 클래스가 등장한다는 전제하에 모델을 설계한다. 그러나 실제 서비스 환경에서는 데이터 수집 방식, 사용자 행동, 계절적 요인 등으로 인해 기존 클래스들의 특성 자체가 지속적으로 변한다. 이러한 상황에서 기존 방법은 알려진 클래스와 새로운 클래스를 구분하는 임계값이 급격히 변질돼 높은 오탐률을 보인다.

CoLOR(Contrastive Learning with Out‑of‑distribution Rejection)는 두 단계로 구성된다. 첫 번째 단계는 대규모 비지도 대비 학습을 통해 특징 공간을 구축하는데, 여기서는 ‘배경 분포 변동’을 고려해 시간‑조건부 배치 정규화와 동적 메모리 뱅크를 사용한다. 두 번째 단계는 ‘분리 가능성(separability)’ 가정을 활용해, 새로운 클래스가 기존 클래스와 일정 거리 이상 떨어져 있다는 전제 하에, 각 샘플의 거리 기반 스코어를 계산하고, 이 스코어가 사전 정의된 임계값을 초과하면 unknown으로 판정한다. 핵심은 임계값을 고정하지 않고, 현재 배경 분포의 통계(예: 평균·공분산)를 실시간으로 추정해 적응형으로 조정한다는 점이다.

이론적 측면에서는 과잉 파라미터화된 선형 모델을 가정하고, ‘분리 가능성’이 충족될 경우 CoLOR가 최소 위험(minimum risk) 솔루션에 수렴함을 증명한다. 특히, 기존 베이스라인(예: Softmax Thresholding, OpenMax) 대비 샘플 복잡도 O(1/√n) 향상을 보이며, 배경 분포가 급격히 변하더라도 일반화 오차가 제한된 상한을 갖는다. 증명 과정에서 Rademacher 복잡도와 변분 거리(Varying Distribution) 개념을 결합해, 배경 분포의 변동량이 일정 범위 내에 있을 때 수렴 속도가 유지된다는 중요한 결과를 도출한다.

실용적인 구현에서는 메모리 효율성을 위해 ‘쿼리‑키‑값’ 구조의 근사 최근접 검색(ANN)와, ‘스케일‑인베리언트’ 정규화 레이어를 도입한다. 또한, 텍스트 데이터에 대해서는 사전 학습된 트랜스포머 모델의 마지막 레이어를 고정하고, 대비 학습만 수행함으로써 연산량을 크게 줄였다. 이러한 설계는 대규모 이미지(예: ImageNet‑O)와 텍스트(예: AGNews‑Open) 데이터셋에서 실시간 추론이 가능하도록 만든다.

실험 결과는 두 가지 축에서 강력한 우위를 보인다. 첫째, 배경 분포가 인위적으로 변하도록 설계한 시뮬레이션(예: 클래스별 색상 변조, 텍스트 도메인 교체)에서 CoLOR는 평균 F1‑score가 12~18% 상승했다. 둘째, 실제 도메인 적응 시나리오(예: 의료 이미지에서 장비 교체, 소셜 미디어에서 트렌드 변화)에서도 기존 방법보다 높은 정확도와 낮은 오탐률을 기록했다. 특히, 새로운 클래스의 샘플 수가 전체의 1% 이하일 때도 성능 저하가 거의 없었으며, 이는 ‘새로운 클래스 크기’가 모델 성능에 미치는 영향을 정량적으로 분석한 최초의 연구라 할 수 있다.

한계점으로는 ‘분리 가능성’ 가정이 현실에서 완전히 충족되지 않을 경우 성능이 급격히 떨어질 수 있다는 점이다. 또한, 실시간 배경 통계 추정에 사용되는 윈도우 크기 선택이 데이터 특성에 민감하게 작용한다는 점을 보완하기 위한 자동 튜닝 메커니즘이 필요하다. 향후 연구에서는 비선형 특징 변환과 베이지안 적응을 결합해 가정 완화와 더 강건한 추론을 목표로 할 예정이다.