비선형 양자 뉴런: 차세대 양자 신경망의 핵심 구성요소
초록
**
본 논문은 양자 회로를 이용해 임의의 비선형 활성화 함수를 근사하고, 이를 기반으로 일반화 가능한 비선형 양자 뉴런 프레임워크를 제안한다. 두 가지 구현 예시(기저 인코딩·진폭 인코딩)를 제시하고, IBM Quantum Experience와 시뮬레이션을 통해 자원 효율성과 정확성을 검증한다.
**
상세 분석
**
논문은 먼저 고전 신경망에서 뉴런이 수행하는 두 단계, 즉 선형 내적 연산과 비선형 활성화 함수를 명확히 구분한다. 양자 컴퓨팅은 본질적으로 선형·유니터리 연산만을 지원하므로, 비선형 함수를 구현하기 위해서는 양자 상태의 측정이나 위상 추정 등 비유니터리 효과를 활용해야 한다는 점을 강조한다. 이를 위해 저자들은 두 종류의 양자 오라클—표준 오라클(S_f)과 최소 위상 오라클(M_f)—을 정의하고, Boolean 함수를 통해 비선형 함수를 근사하는 방법을 제시한다. 특히, Fig. 1(a)와 (b)에서 보여지는 두 회로는 (i) 제어된 X·I 게이트의 직접 매핑과 (ii) 최소 위상 오라클에 역 푸리에 변환을 결합하는 방식을 각각 구현한다. 이러한 회로는 입력 비트열을 직접 제어하거나 위상 정보를 추출해 디지털 형태의 출력 비트를 생성함으로써, 비선형 함수의 디지털 근사를 가능하게 한다.
프레임워크(그림 3)는 크게 세 단계로 구성된다. 첫 번째 단계인 인코딩에서는 고전 데이터 x를 양자 레지스터에 기저 인코딩(각 비트를 개별 큐비트에 매핑) 혹은 진폭 인코딩(데이터를 슈퍼포지션의 진폭에 매핑)으로 변환한다. 두 번째 단계인 진화에서는 가중치 벡터 w와의 내적을 계산한다. 기저 인코딩에서는 제어된 R_z 게이트와 역 푸리에 변환을 이용해 (x·w) 값을 이진 형태 v에 저장하고, 진폭 인코딩에서는 스와프 테스트와 양자 위상 추정을 결합해 γ = arccos(⟨w|x⟩)/π 를 추정한다. 세 번째 단계인 측정에서는 얻어진 이진값(v 혹은 u)을 또 다른 Boolean 오라클 U_g에 입력해 원하는 비선형 활성화 함수 g(v) 혹은 g(u)를 구현한다. 여기서 g는 임의의 비선형 함수(시그모이드, ReLU 등)를 근사하도록 설계된 Boolean 회로이며, 측정 자체가 비선형성을 도입한다는 점이 핵심이다.
두 구현 예시를 구체적으로 살펴보면, 기저 인코딩 기반 뉴런은 입력을 p·n 큐비트(정밀도 p, 차원 n)로 표현하고, 각 입력 비트를 제어하는 C_Rz(α/2^m) 게이트를 통해 (x·w)·2^m 의 위상을 부여한다. 이후 역 푸리에 변환을 적용해 이진값 v를 추출하고, Boolean 오라클을 통해 g(v)를 얻는다. 이 과정에서 사용되는 큐비트 수는 O(p·n)이며, 게이트 복잡도는 O(p·n·m) 수준이다. 진폭 인코딩 기반 뉴런은 로그 n 큐비트만으로 데이터 전체를 표현하고, qRAM을 이용해 |x⟩와 |w⟩를 준비한다. 스와프 테스트와 양자 위상 추정(QPE)을 결합해 γ를 추정하고, 이를 이진화해 u를 만든 뒤 동일하게 Boolean 오라클을 적용한다. 여기서는 큐비트 수가 O(log n + m)으로 크게 절감되지만, QPE와 qRAM 구현에 필요한 복잡도가 추가된다.
자원 분석 측면에서 저자들은 두 구현 모두 입력 크기 n에 대해 다항적(poly(n)) 비용을 요구한다는 점을 강조한다. 특히, 기저 인코딩은 선형적인 큐비트·게이트 증가를 보이며, 진폭 인코딩은 로그 스케일의 큐비트 절감 효과가 있다. 그러나 진폭 인코딩은 qRAM과 QPE라는 고비용 서브루틴에 의존하므로 실제 하드웨어에서 구현 난이도가 높다.
실험 결과는 IBM Quantum Experience(5‑qubit 및 15‑qubit 기기)와 고전 시뮬레이터를 사용해 두 뉴런 모델을 검증한다. 시뮬레이션에서는 시그모이드와 ReLU를 근사하는 Boolean 오라클을 설계해 평균 절대 오차가 0.03 이하임을 보였으며, 실제 IBM 기기에서는 디코히런트와 게이트 오류로 인해 오차가 약 0.1 수준으로 증가했지만, 여전히 비선형 함수 근사가 가능함을 입증했다. 이러한 실험은 제안된 프레임워크가 현재 양자 하드웨어에서도 적용 가능함을 시사한다.
전체적으로 논문은 비선형 양자 뉴런을 구현하기 위한 체계적인 설계 원칙을 제시하고, 기존 연구(예: RUS 기반 뉴런, 위상 추정 기반 뉴런)와 비교해 자원 효율성과 범용성을 동시에 달성한다는 점에서 의미가 크다. 특히, Boolean 오라클을 이용한 비선형 근사와 측정을 통한 비선형성 도입이라는 아이디어는 향후 복합 양자 신경망(QNN) 설계에 있어 핵심 빌딩 블록으로 활용될 가능성이 높다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기