EM 알고리즘의 양자 어닐링 기반 완화 기법

본 논문은 전통적인 EM 알고리즘이 비볼록 최대우도 추정 문제에서 지역 최적점에 머무는 한계를 극복하고자, 양자 플럭투에이션을 도입한 결정론적 양자 어닐링 EM(DQAEM) 알고리즘을 제안한다. 자유에너지(monotonic free energy)를 비용함수로 정의하고, 파인만 경로 적분을 이용해 계산을 근사한다. 이론적으로 비용함수의 단조 감소를 보장하는 정리를 증명했으며, 혼합 요인 분석(MFA) 모델을 통한 실험에서 DQAEM이 EM보다 높…

저자: Hideyuki Miyahara, Koji Tsumura

EM 알고리즘의 양자 어닐링 기반 완화 기법
이 논문은 비볼록 최대우도 추정 문제에서 전통적인 EM(Expectation‑Maximization) 알고리즘이 지역 최적점에 머무르는 한계를 극복하고자, 양자역학의 플럭투에이션을 수학적으로 도입한 결정론적 양자 어닐링 EM(DQAEM) 알고리즘을 제안한다. 먼저 EM 알고리즘을 리뷰하면서 로그우도 L(Y_obs;θ)를 하한인 Q‑함수로 대체해 반복적으로 파라미터를 업데이트하는 기본 구조를 설명한다. EM은 두 가지 장점(혼합 모델 적용 가능, 로그우도 단조 증가)에도 불구하고, 비볼록성으로 인한 지역 최적 문제에 취약함을 지적한다. 다음으로, 양자 어닐링의 개념을 도입한다. 양자 플럭투에이션은 터널링 효과를 통해 에너지 장벽을 넘어 전역 최적에 도달할 가능성을 높인다. 이를 구현하기 위해 자유에너지 F₍β,Γ₎(θ)=−(1/β) log Z₍β,Γ₎(θ) 를 정의하고, β는 역온도, Γ는 양자 플럭투에이션 강도(kinetic term)로 설정한다. β→1, Γ→0이면 자유에너지는 기존 로그우도와 동일해진다. 자유에너지를 내부 에너지 U₍β,Γ₎와 엔트로피 S₍β,Γ₎ 로 분해하고, U₍β,Γ₎를 EM의 Q‑함수와 유사하게 최적화한다. 양자 효과를 포함한 조건부 확률 f_{β,Γ}(x̂|y;θ)는 파인만 경로 적분을 이용해 M개의 베드(시간 슬라이스)로 근사한다. 구체적으로, U₍β,Γ₎(θ;θ′)≈∑_{i=1}^N ∑_{j=1}^M f_{β,Γ}({x_{i}^{j}}|y_i;θ′) log p(y_i, x_{i}^{j};θ) 이며, f_{β,Γ}는 베드 간 가우시안 연결을 포함하는 복합 확률밀도이다. DQAEM 알고리즘은 다음 단계로 구성된다. 1) 초기 β와 Γ 설정(β_init∈(0,1], Γ_init≥0) 후 파라미터 θ⁽0⁾ 초기화. 2) while 수렴 기준 미충족:  a) E‑step: 현재 θ⁽t⁾를 사용해 f_{β,Γ}({x_{i}^{j}}|y_i;θ⁽t⁾) 계산.  b) M‑step: U₍β,Γ₎를 최소화하는 θ⁽t+1⁾ = arg min U₍β,Γ₎(θ;θ⁽t⁾) 구함.  c) β를 증가시키고 Γ를 감소시켜 양자 플럭투에이션을 점진적으로 사라지게 함. 3) U₍β,Γ₎와 S₍β,Γ₎가 변하지 않을 때 종료. 핵심 정리(Theorem 1)는 위 M‑step을 수행하면 자유에너지 F₍β,Γ₎(θ) 가 단조 감소한다는 것을 증명한다. 이는 EM의 로그우도 단조 증가와 직접적인 유사성을 가지며, 알고리즘이 전역 최적 혹은 지역 최적 중 하나에 수렴함을 보장한다. 실험에서는 혼합 요인 분석(MFA) 모델을 사용한다. MFA는 숨은 요인 x와 혼합 인덱스 w를 통해 관측 y를 생성하며, w의 개수 m이 증가할수록 비볼록성이 심화된다. 모델은 p(y|x,w;θ)=N(μ_w+Λ_w x, Φ)와 같은 가우시안 형태를 갖는다. DQAEM에서는 kinetic term H_kin = \hat{π}²/(2μ) (또는 -Γ∂²/∂x²) 를 추가해 양자 효과를 반영한다. 실험 설정은 β=1 고정, Γ를 초기값에서 0으로 선형 감소, 베드 수 M=128, 데이터 포인트 N은 적절히 선택하였다. 수렴 실험에서는 m=1,3,7,10인 네 가지 모델에 대해 자유에너지(−F)와 그 변화량을 플롯하였다. 모든 경우에서 −F가 단조적으로 감소함을 확인했으며, 특히 m≥7인 경우 EM보다 적은 반복 횟수로 최적값에 도달했다. 성공률 비교 실험에서는 동일한 초기 파라미터를 1000번 무작위로 설정한 뒤 DQAEM과 EM을 각각 실행하였다. 성공 기준은 추정된 평균이 실제 평균과의 제곱오차가 각 가우시안 분산의 0.2배 이하인 경우이다. 결과는 DQAEM이 90.7%의 성공률을 보인 반면, EM은 36.6%에 머물렀다. 이는 양자 터널링이 지역 최적에 갇히는 현상을 효과적으로 완화함을 시사한다. 논문의 한계로는 파인만 경로 적분 근사의 정확도가 베드 수 M에 크게 의존한다는 점, 양자 플럭투에이션 스케줄(β, Γ)의 설계가 경험적 튜닝을 필요로 한다는 점, 그리고 현재 구현이 완전 결정론적이며 실제 양자 하드웨어와의 연계가 아직 검증되지 않았다는 점을 들 수 있다. 향후 연구 방향으로는 베드 수 자동 조정, 비선형 β·Γ 스케줄링, 양자 컴퓨팅 기반 샘플링 구현, 그리고 다른 비볼록 모델(예: 딥 베이지안 네트워크)으로의 확장이 제시된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기