연합학습에서 노이즈 클라이언트를 위한 표현 기하학 기반 FedRG
초록
FedRG는 손실값에 의존하는 기존 노이즈 탐지 방식을 넘어, 라벨에 무관한 구형 자기지도 표현을 구축하고, 구면 von Mises‑Fisher 혼합 모델을 이용해 클린 샘플과 노이즈 샘플을 구분한다. 라벨‑조건부와 라벨‑프리 기하학 사이의 분포 차이를 정량화하고, 개인화된 노이즈 흡수 행렬을 결합해 비동질적 연합 환경에서도 강건한 학습을 실현한다.
상세 분석
FedRG는 연합학습(Federated Learning, FL)에서 라벨 노이즈와 데이터 이질성(Non‑IID)이라는 두 가지 핵심 난제를 동시에 해결하고자 한다. 기존 연구들은 주로 로컬 손실값의 크기를 기준으로 “작은 손실” 샘플을 클린으로, 큰 손실 샘플을 노이즈로 판단하는 작은‑손실 휴리스틱에 의존한다. 그러나 비동질적 데이터 분포에서는 희소 클래스(롱테일) 샘플이 본질적으로 높은 손실을 보이기 때문에 손실 기반 판단은 높은 위양성(False Positive)과 위음성(False Negative)을 초래한다. FedRG는 이러한 한계를 극복하기 위해 “표현 기하학 우선” 원칙을 제시한다. 즉, 라벨에 독립적인 내부 표현 구조가 라벨‑조건부 구조와 일치하는 정도를 클린/노이즈 판단의 근거로 삼는다.
구현 단계는 크게 두 부분으로 나뉜다. 첫 번째는 라벨‑프리 자기지도 학습이다. SimCLR과 같은 인스턴스 차별 학습을 이용해 각 클라이언트에서 데이터를 두 번 증강하고, 인코더를 통해 단위 길이 벡터 z∈S^{d‑1} 로 매핑한다. 이 과정에서 NT‑Xent 손실을 최소화함으로써 동일 인스턴스의 두 뷰는 서로 가깝게, 다른 인스턴스는 구면 전체에 고르게 퍼지도록 만든다. 결과적으로 데이터는 구형(구면) 공간에 고르게 분포하면서, 의미적으로 유사한 샘플들은 특정 방향으로 집중되는 “방향성 클러스터”를 형성한다.
두 번째 단계에서는 이러한 구형 표현에 대해 확률적 모델링을 수행한다. FedRG는 구면 von Mises‑Fisher(vMF) 혼합 모델을 도입한다. 각 클러스터 g는 평균 방향 μ_g와 집중도 파라미터 κ_g를 갖는 vMF 성분으로 표현되고, 전체 혼합 비율 π_g는 EM‑like 절차를 통해 추정된다. 또한, 라벨‑프리 기하학 Γ와 라벨‑조건부 기하학 B를 각각 vMF 혼합 모델로 추정한다. 라벨‑조건부 모델은 현재 클린 샘플(라벨이 신뢰된)만을 사용해 업데이트되며, 라벨‑프리 모델은 전체 데이터를 사용한다. 두 모델 사이의 분포 차이, 즉 KL‑divergence 혹은 JS‑divergence를 계산해 각 샘플이 두 모델에 얼마나 일관된지를 측정한다. 클린 샘플은 두 모델이 유사한 확률을 부여하지만, 노이즈 라벨을 가진 샘플은 라벨‑조건부 모델에서 비정상적인 확률을 받아 큰 발산값을 보인다. 이를 임계값 기반으로 노이즈 샘플을 식별하고, 식별된 클린 샘플을 다시 vMF 모델에 반영해 반복적으로 모델을 정제한다.
노이즈 샘플이 식별된 이후에는 “노이즈 흡수 행렬”(Noise Absorption Matrix)을 도입한다. 이는 각 클라이언트별로 추정된 라벨 전이 행렬 Ĉ_k 를 역으로 적용해 손실 함수에 보정항을 추가함으로써, 노이즈 라벨이 모델에 미치는 영향을 완화한다. 개인화된 행렬이므로 클라이언트마다 다른 노이즈 패턴을 반영할 수 있다.
실험에서는 CIFAR‑10/100, FEMNIST 등 여러 벤치마크에 대해 글로벌 노이즈(전체 클라이언트에 동일한 전이 행렬)와 로컬 노이즈(클라이언트마다 다른 전이 행렬) 두 시나리오를 설정했다. 특히 라벨 불균형이 심한 Long‑Tail 설정과 비동질적 데이터 분포를 결합한 경우, 기존 GMM‑기반 손실 방법(FedCorr, FedClean)보다 크게 앞서는 정확도 향상을 보였다. Ablation Study에서는 (1) 자기지도 사전학습 없이 직접 vMF를 적용했을 때 성능 저하, (2) 노이즈 흡수 행렬을 제외했을 때 정확도 감소, (3) vMF 혼합 대신 단일 가우시안 모델을 사용했을 때 클러스터링 품질 악화 등을 확인해 각 구성 요소의 필요성을 입증했다.
핵심 기여는 다음과 같다. 첫째, 라벨‑프리 구형 표현을 활용해 손실에 의존하지 않는 노이즈 탐지 기준을 제시했다. 둘째, vMF 혼합 모델을 통해 구면상의 의미적 클러스터를 정량화하고, 라벨‑프리와 라벨‑조건부 모델 간의 기하학적 발산을 노이즈 판단 근거로 활용했다. 셋째, 개인화된 노이즈 흡수 행렬을 결합해 식별된 노이즈 샘플을 효과적으로 완화했다. 넷째, 비동질적 연합 환경에서도 높은 정확도와 안정성을 유지함을 실험적으로 증명했다.
전반적으로 FedRG는 “표현 기하학 우선”이라는 새로운 패러다임을 제시함으로써, 연합학습에서 라벨 노이즈와 데이터 이질성을 동시에 다루는 강력한 프레임워크를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기