연합 학습을 위한 클러스터링·주기형 양자 파라미터 통합 프레임워크
초록
FEDCOMPASS는 비동질적(IID) 데이터 환경에서 하이브리드 클래식‑양자 모델을 효율적으로 학습하기 위해 두 단계의 집계 전략을 제안한다. 서버는 클라이언트의 클래스 분포 벡터를 이용해 스펙트럴 클러스터링으로 유사한 클라이언트를 그룹화하고, 각 클러스터 내에서 가중 평균을 통해 클래식 피처 추출기를 집계한다. 양자 파라미터는 각 차원을 단위 원 위에 매핑한 뒤 원형 평균(circular mean)으로 평균을 구하고, FedAdam‑유사 적응형 옵티마이저로 전역 업데이트한다. 실험 결과 MNIST, Fashion‑MNIST, CIFAR‑10에서 비IID 설정(α=0.3, 0.7) 하에 기존 6가지 연합 학습 기법보다 최대 10.22% 높은 정확도와 더 안정적인 수렴을 달성한다.
상세 분석
FEDCOMPASS는 기존 연합 학습이 직면한 두 가지 핵심 문제—클래식 피처 추출기의 데이터 분포 불균형과 양자 파라미터의 주기성(Periodicity)—를 각각 전용 메커니즘으로 해결한다. 첫 번째 단계에서는 각 클라이언트가 로컬 데이터의 클래스 비율을 C‑차원 벡터 p̂_i 로 요약하고, 이를 기반으로 Jensen‑Shannon 발산과 샘플 수 차이를 결합한 유사도 행렬 S_ij = exp(−λ₁·JS(p̂_i,p̂_j)−λ₂·|n_i−n_j|/(n_i+n_j)) 를 계산한다. λ₁, λ₂는 데이터 분포와 규모 균형을 조절하는 하이퍼파라미터이며, 정규화 라플라시안에 대한 고유값 분해 후 상위 M개의 고유벡터에 K‑means를 적용해 클러스터 C₁…C_M을 도출한다. 클러스터 내에서는 샘플 수 n_i 를 가중치로 하는 가중 평균 θ^(m)c = ∑{i∈C_m} n_i·θ_i / ∑_{i∈C_m} n_i 로 클래식 피처 추출기의 파라미터를 집계한다. 이 과정은 비IID 환경에서 각 클러스터가 내부적으로 데이터 분포 일치를 보장함으로써 전역 모델 편향을 크게 감소시킨다.
두 번째 단계는 양자 회로 파라미터 ϕ_i ∈ ℝ^m 의 주기성을 고려한다. 각 차원 j에 대해 클라이언트 가중치 ω_i = n_i/∑_j n_j 로 스케일링한 뒤, sin과 cos을 이용해 단위 원 위에 매핑하고 atan2 함수를 통해 평균 각도 ϕ̄_j = atan2(∑_i ω_i·sin ϕ_i^{(j)}, ∑i ω_i·cos ϕ_i^{(j)}) 를 계산한다. 이렇게 얻은 ϕ̄는 원형 평균으로, 0과 2π 사이의 불연속성을 회피한다. 이후 FedAdam과 동일한 모멘텀·편향 보정 절차를 적용해 전역 파라미터 ϕ{t+1} = ϕ_t − η·\hat{m}_t/(\sqrt{\hat{v}_t}+ε) 로 업데이트한다. 적응형 옵티마이저는 학습률 스케일링과 노이즈 억제 효과를 제공해 양자 회로의 미세 조정을 안정화한다.
실험 설계는 10명의 클라이언트를 가정하고, 각 클라이언트는 5번의 로컬 에포크를 수행한다. 데이터는 Dirichlet(α) 분할로 비IID 정도를 조절했으며, α=0.3(고비동질)와 α=0.7(중간) 두 설정을 사용했다. 클래식 피처 추출기로는 MNIST에 LeNet, CIFAR‑10·Fashion‑MNIST에 ResNet‑18 앞 두 레이어를 채택했고, 양자 부분은 파라미터화된 양자 회로(PQC)를 적용했다. 베이스라인으로 FedAvg, FedProx, FedBN, FedPer, FedNova, Scaffold를 비교했으며, 모든 실험은 동일한 Adam 학습률(0.001)과 동일한 통신 라운드(5)를 유지했다.
결과는 표 1에 요약된다. MNIST에서는 FEDCOMPASS가 99.69%~99.76%의 정확도로 거의 최적에 도달했으며, CIFAR‑10에서는 α=0.3에서 77.00% (FedAvg 대비 +10.22%)와 α=0.7에서 80.10% (FedAvg 대비 +3.80%)를 기록했다. 특히 클러스터링을 제거한 경우 정확도가 급격히 하락했으며, 원형 평균을 제외하면 수렴이 불안정하고 정확도가 25% 수준에 머물렀다. 이는 두 메커니즘이 각각 클래식 파라미터와 양자 파라미터에 필수적임을 입증한다. 수렴 곡선에서도 FEDCOMPASS는 초기 라운드부터 빠르게 정확도가 상승하고, 변동폭이 작아 전체 학습 과정이 안정적이었다.
이 논문은 비IID 환경에서 하이브리드 클래식‑양자 연합 학습을 실용화하기 위한 설계 원칙을 제시한다. 스펙트럴 클러스터링 기반의 데이터‑주도 클러스터링은 통계적 동질성을 보장해 클래식 피처 학습의 편향을 최소화하고, 원형 평균과 적응형 옵티마이저는 양자 파라미터의 주기적 특성을 보존하면서 전역 최적화를 가능하게 한다. 향후 연구에서는 클러스터 수 자동 결정, 양자 회로 깊이 최적화, 그리고 실제 NISQ 디바이스에서의 통신 비용 분석 등을 통해 프레임워크를 확장할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기