양자 컴퓨팅을 이용한 단백질 결합부위 구조 예측 실용 수준 프로세서 구현
초록
본 논문은 짧고 유연한 펩타이드 조각의 결합부위 3차원 구조를 예측하기 위해, 아미노산 서열을 테트라헤드랄 격자에 매핑하고 물리·기하학적 제약을 파우리 연산자로 표현한 Hamiltonian을 VQE로 최소화하는 전체 파이프라인을 제시한다. 두 단계(에너지 추정‑측정 디코딩) 실행 구조와 IBM‑Cleveland Clinic 127‑qubit 초전도 프로세서에서의 실제 실험을 통해, AlphaFold 3와 기존 시뮬레이션 기반 방법을 RMSD와 도킹 효율 모두에서 능가함을 입증한다.
상세 분석
이 연구는 현재 실용 수준(utility‑level) 양자 하드웨어가 갖는 제한—짧은 코히런스 시간, 게이트 오류, 제한된 큐비트 수—을 정면으로 고려한 설계가 가장 큰 특징이다. 먼저 아미노산 서열을 테트라헤드랄 격자 모델에 매핑함으로써 각 잔기를 네 방향 연결 가능한 노드로 단순화한다. 이는 기존의 원자 수준 좌표를 직접 양자화하는 방식보다 차원 수를 크게 줄여, 수십에서 백여 개 큐비트 내에 문제를 압축할 수 있게 한다.
구조적 제약(입체 충돌, 키랄리티, 거리·각도 제한)과 Miyazawa‑Jernigan 상호작용을 파우리 연산자 형태의 희소 Hamiltonian으로 변환한다. 파우리 연산자는 양자 회로에서 효율적으로 구현 가능하며, 희소성은 측정 샷 수를 최소화하면서도 에너지 기대값을 정확히 추정할 수 있게 한다.
VQE 최적화는 두 단계로 나뉜다. 1단계에서는 파라미터화된 회로를 이용해 에너지 추정을 수행하고, COBYLA와 같은 비구배 기반 클래식 옵티마이저로 파라미터를 반복 업데이트한다. 여기서 2,000 샷·200회 이상의 반복을 사용해 노이즈를 평균화한다. 2단계에서는 최적화된 파라미터를 고정하고, 동일한 ansatz를 기반으로 하드웨어 친화적인 네이티브 게이트만으로 구성된 고정 회로를 재컴파일한다. 이 회로를 20,000 샷 이상 실행해 비트스트링을 수집하고, 가장 빈도 높은 결과를 역매핑해 백본 좌표를 복원한다. 두 단계 분리는 최적화 과정에서 발생하는 파라미터 변동에 따른 측정 오류를 최소화하고, 재현성을 높이는 효과가 있다.
실험은 IBM‑Cleveland Clinic 127‑qubit 초전도 프로세서에서 직접 수행되었으며, 23개의 PDBbind 단백질‑리간드 복합체와 7개의 치료 타깃 조각을 대상으로 했다. 각 조각은 1020개의 잔기로 구성돼, 요구 큐비트 수가 40110개에 달했다. 결과는 RMSD 평균이 AlphaFold 3보다 약 0.3 Å 낮았으며, AutoDock Vina 기반 도킹 스코어에서도 유의미하게 개선되었다. 이는 양자 최적화가 에너지 지형의 전역 최소점을 더 효과적으로 탐색함을 시사한다.
한계점으로는(1) 현재 양자 회로 깊이가 약 150–200 게이트 수준에 머물러, 복잡한 장거리 상호작용을 완전하게 포착하기 어렵다. (2) VQE 최적화에 사용된 COBYLA는 지역 최소에 빠질 위험이 있어, 더 정교한 변분 알고리즘(예: ADAPT‑VQE)이나 양자 자연 진화 전략이 필요할 수 있다. (3) 실험에 사용된 샷 수와 최적화 반복 횟수가 상당히 높아, 실제 연구 환경에서 비용 효율성을 확보하려면 샷 절감 및 오류 정정 기법이 추가돼야 한다.
전반적으로 이 논문은 양자 컴퓨팅을 구조생물학의 실용적인 문제에 적용한 최초의 엔드‑투‑엔드 구현 사례이며, 하드웨어‑소프트웨어 공동 설계, 문제 특화 인코딩, 두 단계 실행 전략이 실용 수준 양자 프로세서에서도 의미 있는 과학적 가치를 창출할 수 있음을 보여준다. 향후 더 큰 큐비트 수와 향상된 오류 정정이 제공될 경우, 전체 단백질 혹은 대규모 복합체의 구조 예측에도 확장 가능할 것으로 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기