초전도 양자 프로세서로 구현한 연속 학습: 재앙적 망각을 EWC로 극복한 실험

초전도 양자 프로세서로 구현한 연속 학습: 재앙적 망각을 EWC로 극복한 실험
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 18개의 트랜스몬 큐비트를 이용해 216개의 변분 파라미터를 가진 양자 분류기를 구축하고, 세 가지 서로 다른 데이터셋(패션‑MNIST, MRI, 양자 위상)에 순차 학습시켰다. EWC(Elastic Weight Consolidation) 기법을 적용하지 않을 경우 새로운 과제 학습 후 이전 과제 성능이 급격히 하락하는 재앙적 망각이 관찰되었다. 파라미터 이동 규칙을 이용해 실험적으로 피셔 정보를 추정하고 EWC를 도입하면 세 과제 모두에서 평균 92.3 % 이상의 정확도를 유지하며, 동일 파라미터 수를 가진 고전 신경망보다 양자 모델이 95.8 % 대비 81.3 %의 우위를 보였다. 이는 NISQ 디바이스에서도 연속 학습이 가능함을 입증한다.

상세 분석

본 논문은 변분 양자 회로(VQC)를 기반으로 한 양자 분류기의 연속 학습 가능성을 최초로 실험적으로 검증하였다. 18개의 초전도 트랜스몬 큐비트를 2‑D 격자 형태로 배열하고, 각 큐비트 사이의 가변 결합을 활용해 깊이 20, 파라미터 216개의 회로를 설계하였다. 이 회로는 입력 데이터를 양자 상태로 인코딩한 뒤, 다중 층의 파라미터화된 단일·두 큐비트 게이트를 적용해 특징을 추출하고, 최종 측정값을 클래시피케이션 확률로 변환한다. 학습 손실은 이진 교차 엔트로피이며, 파라미터 업데이트는 파라미터 이동 규칙(parameter‑shift rule)을 이용해 직접 실험에서 측정한 기대값으로 수행한다.

연속 학습 시나리오는 세 개의 순차 과제(T₁: 패션‑MNIST의 티‑셔츠 vs 앵클부츠, T₂: MRI의 손 vs 유방, T₃: SPT 위상 vs AF 위상)로 구성된다. EWC를 적용하지 않을 경우, 각 과제 학습 후 이전 과제에 대한 정확도가 30 % 이하로 급락하는 재앙적 망각이 명확히 드러난다. 이는 변분 파라미터가 새로운 데이터 분포에 과도하게 적응하면서 이전 최적점에서 멀어지기 때문이다.

EWC는 이전 과제의 파라미터 최적점 θₜ와 피셔 정보 Fₜ,ⱼ를 이용해 파라미터 변화를 정규화한다. 피셔 정보는 현재 파라미터에서의 로그우도 2차 미분을 근사한 값으로, 파라미터 이동 규칙을 통해 실험적으로 추정한다. 손실 함수에 λ·F·(θ−θ)² 항을 추가함으로써 중요한 파라미터의 변화를 억제하고, 새로운 과제에 대한 학습 플라스틱성을 유지한다. 실험에서는 λ 값을 과제마다 최적화했으며, 결과적으로 세 과제 모두에서 평균 92.3 % 이상의 정확도를 달성하였다.

또한, 동일한 파라미터 수(≈200)와 유사한 구조를 가진 고전 피드포워드 신경망과 비교했을 때, 양자 모델은 T₁·T₂·T₃ 순서의 연속 학습에서 95.8 % 대비 81.3 %의 정확도 차이를 보이며 양자 우위를 시연한다. 이는 양자 회로가 고차원 Hilbert 공간에서 데이터를 효율적으로 임베딩하고, 파라미터 공유 구조가 재사용 가능성을 높이기 때문으로 해석된다.

마지막으로, 실험 장치의 게이트 피델리티가 평균 99.96 % (단일)와 99.68 % (두 큐비트) 수준임을 강조한다. 이러한 높은 피델리티는 파라미터 이동 규칙과 피셔 정보 추정의 정확성을 보장하며, NISQ 수준에서도 연속 학습이 실현 가능함을 입증한다. 전체적으로, 본 연구는 양자 변분 회로와 EWC를 결합한 연속 학습 프레임워크가 실제 초전도 하드웨어에서 작동함을 보여주며, 향후 양자 인공 일반 지능(AGI) 구현을 위한 중요한 실험적 토대를 제공한다.


댓글 및 학술 토론

Loading comments...

의견 남기기