계층형 분할 연합 학습을 위한 장치 연계 및 자원 배분
초록
본 논문은 6G 기반의 우주·공중·지상 통합망(SAGIN)에서 연합 학습(Federated Learning)의 자원 제약과 데이터 불균형 문제를 해결하기 위해 계층형 분할 연합 학습(HSFL) 프레임워크를 제안한다. 모델 분할 레이어 선택, 장치‑UAV 연계, 그리고 통신·컴퓨팅 자원 할당을 공동 최적화하는 문제를 수식화하고, 이를 여러 서브문제로 분해한 뒤, 브루트‑포스 방식의 분할점 탐색과 반복 최적화를 결합한 알고리즘을 설계한다. 시뮬레이션을 통해 제안 방법이 학습 손실과 지연을 균형 있게 최소화함을 입증한다.
상세 분석
본 연구는 SAGIN 환경에서 연합 학습을 수행할 때 발생하는 두 가지 핵심 난제를 체계적으로 분석한다. 첫째, 모바일 디바이스는 연산 능력이 제한돼 깊은 신경망 전체를 학습하기 어렵고, 이로 인해 학습 지연이 크게 증가한다. 둘째, 디바이스 간 데이터 분포가 이질적이어서 전통적인 연합 학습에서는 모델 수렴 속도가 저하되고 최종 정확도가 떨어진다. 이를 해결하기 위해 저자는 모델을 레이어 단위로 분할하는 Split Federated Learning(SFL) 개념을 계층적으로 확장한 HSFL을 도입한다.
수학적 수렴 분석에서는 각 디바이스의 손실 함수가 β‑Lipschitz 연속이며 µ‑강한 볼록성을 가진다고 가정하고, 분산된 SGD 과정에서 발생하는 그래디언트 분산 및 상한을 명시한다. 정리 1에 의해, 분할 레이어 ℓ가 깊어질수록 상한값 ρ·γ가 증가하고, 이는 수렴 속도와 최종 손실에 부정적 영향을 미친다. 또한 데이터 이질성 메트릭 Γ가 손실 상한에 직접 기여함을 보여, 장치‑UAV 연계가 데이터 불균형 완화에 중요한 역할을 함을 이론적으로 뒷받침한다.
통신·컴퓨팅 모델은 UAV와 디바이스 간의 거리·각도 기반 경로 손실 모델을 사용해 전송률 rₙ,ₖ를 정의하고, 분할 레이어 ℓ에 따른 중간 피처 크기 M_ℓ와 디바이스 연산 부하 C_ℓⁿ을 고려해 전송 지연 t_{ℓ,n,k}와 연산 지연 t_{ℓ,n}^{cp}를 도출한다. UAV‑위성 링크는 Weibull 분포 기반 강수 감쇠를 포함한 채널 이득 H_{k,s}를 사용해 전송률 r_{k,s}를 계산한다. 전체 학습 지연 T는 디바이스‑UAV 최대 지연 t_d, UAV‑위성 최대 지연 t_u, 그리고 위성 전환 지연 N_sw·τ_s을 합산한 형태로 표현된다.
최적화 문제 P1은 학습 손실과 지연의 가중합 (1−θ)·T + θ·P 를 최소화하는 것을 목표로 하며, 변수 집합 {ℓ, a_{n,k}, l_{n,k}, B_k, f_{n,k}}를 포함한다. 여기서 P는 데이터 이질성에 기인한 손실 항으로, 각 UAV k에 할당된 디바이스들의 클래스 비율 차이 ‖p_n(c)−p(c)‖ 를 제곱합한 형태이다. 제약식은 대역폭, 연산 자원, 연계 일관성 등을 포함하는 복합적인 MINLP 형태이다.
문제 해결 전략은 (i) 고정된 분할 레이어 ℓ에 대해 자원 할당을 최적화하고, (ii) 최적 자원 할당을 기반으로 디바이스‑UAV 연계를 최적화하며, (iii) 모든 ℓ에 대해 위 과정을 반복해 최적 ℓ를 선택하는 3단계 절차로 구성된다. 대역폭 할당은 정리 2에 의해 폐쇄형 해 l_{n,k}와 B_k를 얻을 수 있으며, 이는 이분법을 통해 t_d 를 구한 뒤 식 (8) 로 계산한다. 연산 자원 할당은 KKT 조건을 적용해 f_{n,k}* = (C_{ℓ}^{n,k} / Σ_{i∈N_k} C_{ℓ}^{i,k})·f_k 로 구한다.
디바이스 연계 최적화는 라그랑주 승수를 도입해 선형화된 목적식 (12)를 풀고, 최종 연계 기준 (13)을 도출한다. 이 기준은 통신 지연, 연산 지연, 그리고 데이터 이질성 가중치를 모두 고려한 복합 비용 함수를 최소화하는 UAV 선택을 의미한다. 전체 알고리즘은 Algorithm 1에 요약되어 있으며, 복잡도는 후보 레이어 수 L에 비례하는 O(L) 수준이다.
시뮬레이션에서는 다양한 UAV 수, 데이터 불균형 정도, 그리고 지연 가중치 θ 값을 변동시켜 제안 알고리즘이 기존 연합 학습 및 기존 SFL 대비 학습 손실을 평균 15% 이상 감소시키고, 지연도 20% 이상 단축함을 확인한다. 특히 데이터 이질성이 심한 경우에도 연계 최적화를 통해 손실 상승을 억제하는 효과가 두드러졌다.
이러한 분석을 종합하면, 본 논문은 (1) HSFL의 수렴 특성을 이론적으로 규명하고, (2) 통신·컴퓨팅·데이터 이질성을 동시에 고려한 공동 최적화 프레임워크를 제시하며, (3) 실용적인 저복잡도 알고리즘을 통해 SAGIN 환경에서 연합 학습의 효율성을 크게 향상시킨다는 세 가지 주요 공헌을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기