양자 순환 유닛 NISQ 시대 파라미터 효율적 신경망
초록
본 논문은 양자 제어‑스왑(Fredkin) 게이트를 이용해 정보 선택 메커니즘을 구현한 Quantum Recurrent Unit(QRU)를 제안한다. QRU는 입력과 숨은 상태를 각 타임스텝마다 동일한 파라미터 집합으로 처리하며, 측정 결과를 피드포워드 방식으로 다음 단계에 전달함으로써 시퀀스 길이에 관계없이 회로 깊이와 파라미터 수가 일정하게 유지된다. 실험에서는 72개의 파라미터로 197‑parameter GRU와 동등한 시계열 예측 성능을, 35개의 파라미터로 96.13% 정확도의 유방암 진단, 132개의 파라미터로 98.05% 정확도의 MNIST 분류를 달성하였다.
상세 분석
QRU는 기존 양자 순환 신경망이 직면한 두 가지 핵심 제약, 즉 제한된 큐비트 수와 깊이 증가에 따른 디코히런스 문제를 근본적으로 해결한다. 첫째, QRU는 고전 GRU의 업데이트·리셋 게이트를 양자 제어‑스왑(C‑SWAP) 연산으로 대체한다. C‑SWAP은 제어 큐비트의 상태에 따라 두 타깃 큐비트의 정보를 선택적으로 교환하므로, 고전적인 시그모이드 기반 게이트와 동일한 ‘정보 선택’ 역할을 양자 중첩 상태 안에서 동시에 수행한다. 이 과정에서 제어 큐비트 자체가 새로운 입력 정보와 이전 숨은 상태의 가중합을 담당하므로, 별도의 클래식 연산 없이 양자 회로 내부에서 업데이트와 리셋이 동시에 이루어진다.
둘째, QRU는 파라미터 공유와 측정 기반 피드포워드 메커니즘을 통해 시퀀스 길이에 무관한 고정 회로 깊이를 유지한다. 입력·숨은 상태 인코딩 단계에서는 각 데이터 포인트를 회전각으로 변환해 angle‑encoding을 사용하고, 이후 C‑SWAP과 변분 레이어를 거친 뒤 Z·X 기반 측정을 수행한다. 측정값은 즉시 다음 타임스텝의 숨은 상태 초기값으로 재사용되며, 동일한 파라미터 집합(가중치 행렬 및 회전 각도)만이 반복적으로 적용된다. 따라서 시퀀스가 길어질수록 회로 깊이가 선형적으로 늘어나지 않아, NISQ 디바이스의 제한된 코히런스 타임 내에서 안정적인 학습이 가능하다.
구조적 측면에서 QRU는 4개의 데이터 큐비트, 4개의 숨은 큐비트, 2개의 보조 큐비트로 구성된 기본 블록을 제시한다. 인코딩 단계는 회전 게이트와 CNOT을 조합해 데이터와 숨은 상태 사이에 얽힘을 도입하고, 변분 레이어는 다중 회전 게이트와 파라미터화된 CNOT 네트워크로 구성된다. 이러한 설계는 양자 회로의 보편 근사성(Universal Approximation Property)을 활용하면서도, 각 레이어의 깊이를 최소화해 NISQ 환경에 최적화한다.
실험 결과는 QRU의 파라미터 효율성을 명확히 보여준다. 72개의 파라미터로 구성된 QRU는 197‑parameter GRU와 동등한 성능을 보이며, 35개의 파라미터만으로도 96.13% 정확도의 유방암 진단을 달성한다. 특히 MNIST 실험에서는 132개의 파라미터로 98.05% 정확도를 기록, 27,265‑parameter CNN을 능가한다. 이는 양자 회로가 고차원 특징을 압축적으로 표현할 수 있음을 시사한다.
하지만 현재 구현은 시뮬레이션 기반이며, 실제 NISQ 디바이스에서의 게이트 오류와 측정 노이즈에 대한 내성 검증이 부족하다. 또한 C‑SWAP 게이트는 현재 양자 하드웨어에서 구현 비용이 높아, 효율적인 대체 게이트 설계가 필요하다. 향후 연구에서는 오류 보정 기법과 하드웨어 친화적 게이트 집합을 도입해 실험적 검증을 확대하고, QRU를 Transformer와 같은 복합 아키텍처에 통합하는 방안을 모색할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기