양자와 의사난수 생성기의 머신러닝 성능 영향 비교

본 논문은 CPU 기반 의사난수(PRNG)와 QPU 기반 양자난수(QRNG)를 이용해 Dense NN, CNN, Random Tree, Random Forest 등 네 가지 머신러닝 모델을 실험한다. Accent와 EEG 데이터, MNIST·CIFAR‑10 이미지 등에서 초기 가중치와 트리 분할에 사용된 난수 종류가 미세하지만 데이터 의존적인 정확도 차이를 만든다. QRNG가 일부 경우에 0.1%~2.8% 정도 우위를 보였지만, Random T…

저자: Jordan J. Bird, Aniko Ekart, Diego R. Faria

양자와 의사난수 생성기의 머신러닝 성능 영향 비교
이 논문은 소프트 컴퓨팅 분야에서 난수 생성기의 종류가 머신러닝 모델의 학습 및 예측 성능에 미치는 영향을 체계적으로 조사한다. 연구자는 CPU 기반의 전통적인 의사난수(PRNG)와 QPU(양자 처리 장치) 기반의 양자난수(QRNG)를 각각 사용해 네 가지 실험을 설계하였다. 첫 번째 실험은 Dense Neural Network(전층 신경망)의 가중치 초기화에 난수를 적용한 것으로, Accent 데이터셋에서는 QRNG가 정확도를 +0.1% 향상시켰고, EEG(뇌파) 데이터셋에서는 +2.82%의 개선을 보였다. 두 번째 실험은 Convolutional Neural Network(CNN)에서 MNIST와 CIFAR‑10 이미지 분류를 수행했으며, MNIST에서는 초기 학습 속도가 QRNG에서 더 빠르지만 최종 정확도 차이는 0.02%에 불과했다. CIFAR‑10에서는 QRNG가 +0.92%의 소폭 우위를 기록했다. 세 번째 실험은 Random Tree(전통적인 결정 트리)와 Quantum Random Tree(QRT) 간의 성능 차이를 비교하였다. 200개의 트리를 각각 100개씩 학습시킨 결과, QRT는 Accent 데이터에서 평균 -0.12%, EEG 데이터에서 -0.28%의 정확도 감소를 보이며, 전통적인 트리보다 약간 열등한 것으로 나타났다. 네 번째 실험은 Random Forest와 Quantum Random Forest(QRF)의 앙상블 성능을 평가하였다. 100개의 트리를 사용했을 때, RF가 QRF보다 Accent 분류에서 0.14%, EEG 분류에서 0.08% 높은 정확도를 보였지만, QRF는 동일한 정확도를 절반 수준의 트리 수(50개)로도 달성할 수 있어 모델 복잡도와 메모리 사용량 측면에서 잠재적 장점을 시사한다. 논문은 또한 양자 난수와 의사난수의 이론적 차이를 서술한다. 고전 컴퓨팅에서는 난수가 결정론적 알고리즘에 의해 생성되며, 시드값에 따라 재현 가능하지만 진정한 무작위성을 제공하지 못한다. 반면 양자역학의 측정 과정은 본질적으로 50/50 확률을 갖는 비결정적 현상으로, QRNG는 이러한 물리적 현상을 이용해 비트당 완전한 무작위성을 확보한다. 저자는 이러한 차이가 머신러닝 초기화 단계에서 미세한 차이를 만들 수 있다고 가정하고 실험을 진행하였다. 실험 결과는 전반적으로 데이터와 모델에 따라 QRNG가 약간의 이점을 제공하거나 오히려 성능이 떨어질 수 있음을 보여준다. 특히 가중치 초기화와 같은 초기 단계에서는 QRNG가 학습 수렴 속도에 영향을 줄 수 있지만, 최종 정확도 차이는 통계적으로 유의미한 수준에 도달하지 못한다. 또한 트리 기반 모델에서는 난수에 의해 생성된 분할 기준이 균형성을 약간 해칠 수 있어, 전통적인 PRNG가 더 안정적인 성능을 제공한다는 점이 강조된다. 논문의 한계점으로는 실험 반복 횟수와 통계적 검증이 명시되지 않아 결과의 신뢰성이 떨어진다는 점, 난수 품질(엔트로피, 비트 독립성) 평가가 부재한 점, QRNG 하드웨어의 비용·지연·접근성에 대한 논의가 부족한 점을 들 수 있다. 또한, 모델 학습에 사용된 하이퍼파라미터가 난수 종류에 따라 최적화되지 않았을 가능성도 있다. 결론적으로, 양자 난수는 특정 상황에서 소량의 성능 향상을 제공할 수 있지만, 현재 수준에서는 대부분의 실용적인 머신러닝 작업에 있어 PRNG와 큰 차이를 보이지 않는다. 향후 연구에서는 다양한 QRNG 소스와 더 큰 규모의 데이터셋, Monte Carlo 시뮬레이션, 강화학습 등 난수 의존도가 높은 알고리즘에 대한 장기적인 수렴 분석과 비용 대비 효과 평가가 필요하다. 이러한 추가 연구를 통해 양자 난수가 실제 산업 현장에서 언제, 어떻게 채택될 수 있는지에 대한 명확한 가이드라인을 제시할 수 있을 것이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기