대규모 격자에서 신경망 양자 상태를 이용한 열역학극한 접근
초록
본 논문은 트랜스포머 기반 신경망 양자 상태(NQS)에 거리 의존 커널을 도입한 ‘Spatial Attention’ 메커니즘을 제안한다. 단일 학습 가능한 길이 스케일만으로 물리적 인덕티브 바이어스를 제공해 최적화 안정성을 크게 향상시키고, 2차원 삼각 격자 Heisenberg 반강자성체를 42×42 사이트까지 시뮬레이션한다. 정확한 에너지와 자기화, 스핀 파동 속도, 균일 감수성 등을 유한 크기 스케일링으로 추정했으며, 기존 iPEPS 및 다른 NQS 방법보다 우수한 열역학극한 결과를 얻었다. 또한 J₁‑J₂ 정사각형 격자 모델에서도 최첨단 성능을 보이며, 비국소적인 부호 구조가 존재함을 실증한다.
상세 분석
이 연구는 변분 몬테카를로(VMC)와 스토캐스틱 재구성(SR) 최적화를 기반으로 하는 신경망 양자 상태(NQS)의 확장성을 근본적으로 개선한다. 기존 Vision Transformer(ViT) 기반 NQS는 전역적인 어텐션을 사용하지만, 시스템 규모가 커질수록 거리 의존성을 학습하기가 어려워 최적화가 불안정해진다. 저자들은 어텐션 가중치에 exp(−γ d(i,j)) 형태의 거리 감쇠 커널을 곱해 ‘Spatial Attention’ 메커니즘을 도입한다. 여기서 γ 는 학습 가능한 역길이 스케일이며, 각 어텐션 헤드마다 독립적인 γ 를 부여해 다중 상관 길이를 동시에 표현한다. 이 구조는 물리적으로 의미 있는 ‘클러스터 속성’—즉, 국소 상호작용이지만 장거리 상관을 허용하는 특성—을 인덕티브 바이어스로 제공한다. 구현은 기존 ViT 코드에 한 줄만 추가하면 되며, 전역 연결성을 유지하면서도 거리 기반 억제를 부드럽게 적용한다는 장점이 있다.
삼각 격자 Heisenberg 모델에 적용한 결과는 두드러진다. 42×42(≈1764 스핀) 규모까지 정확한 변분 에너지를 얻었으며, 에너지와 자기화는 1/L³ 스케일링을 따르는 것으로 확인돼 열역학극한으로의 외삽이 신뢰할 만했다. 외삽된 에너지 E₀ = −0.55168(2) J는 최신 iPEPS(D→∞) 결과보다 낮으며, 이는 변분 파동함이 실제 바닥 상태에 더 근접함을 의미한다. 자기화는 M₀ = 0.148(1) 로, 고전값 대비 약 30 %에 불과해 강한 양자 요동을 반영한다. 기존 선형 스핀파(LSW) 이론이 예측한 0.239 와 비교하면 약 62 %의 차이가 나며, 이는 삼각 격자에서 비국소적인 부호 구조가 중요한 역할을 함을 시사한다. 실제로 최적화된 파동함에 대해 제안된 국소 부호 변환을 적용하면 부호 겹침이 시스템 크기와 함께 지수적으로 감소해, 부호 문제를 완전히 제거할 수 없음을 실증한다.
또한 J₁‑J₂ 정사각형 격자 모델(20×20)에서도 동일한 Spatial Attention ViT를 사용해 기존 Residual CNN 기반 NQS보다 낮은 에너지를 달성했다. 이는 제안된 메커니즘이 모델에 특화되지 않고 일반적인 2차원 양자 스핀 시스템에 적용 가능함을 보여준다. 파라미터 수는 ≈ 4.5 × 10⁵ 정도로 고정돼 있어, 시스템 크기에 비례해 네트워크를 확장할 필요가 없으며, 이는 실제 물리 시뮬레이션에서 중요한 스케일러빌리티를 제공한다. 전체적으로 이 논문은 물리적 인덕티브 바이어스를 최소한의 형태로 신경망에 통합함으로써, 대규모 양자 다체 문제에 대한 변분 접근법의 정확도와 확장성을 동시에 끌어올린 혁신적인 사례라 할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기