단일 단계로 DFT 수준 분자 구조를 정밀하게 개선하는 GeoOpt Net
초록
GeoOpt-Net은 SE(3) 등가성을 갖는 다중 브랜치 그래프 신경망으로, 저비용 힘장 기반 초기 컨포머를 입력받아 한 번의 순전파만으로 B3LYP/TZVP 수준의 DFT 품질 구조를 예측한다. 두 단계 사전학습·미세조정 전략과 이론·기저집합 인식을 위한 Fidelity‑aware Feature Modulation(FAFM)으로 다양한 화학 공간에 일반화되며, 외부 약물 후보군 테스트에서 전원 원자 RMSD가 0.001 Å 이하, 에너지 오차가 거의 0에 가까운 성능을 보인다. 또한 DFT 수렴 기준을 만족하는 초기 구조를 제공해 재최적화 단계와 계산 시간을 크게 단축한다.
상세 분석
GeoOpt-Net의 핵심 혁신은 SE(3) 등가성을 명시적으로 구현한 그래프 신경망을 세 개의 독립 스트림(결합 길이, 결합 각, 이면각)으로 분리하고, 이를 경량 트랜스포머 디코더로 결합해 좌표를 직접 업데이트한다는 점이다. 이 설계는 물리적 대칭성을 보존하면서도 원자 간 거리·각·이면각 정보를 고차원 텐서 형태로 효율적으로 전달한다. 특히 Clebsch–Gordan 텐서 곱을 이용한 방향성 피처 결합은 기존 DimeNet·GemNet 계열보다 더 정교한 각도 의존성을 학습하게 해, 복잡한 토션을 가진 약물 분자에서도 높은 정확도를 유지한다.
두 단계 학습 프로토콜은 저비용 B3LYP/6‑31G(2df,p) 데이터셋(QM9·QM40)에서 대규모 기하학적 사전학습을 수행해 일반적인 결합 패턴과 토션 통계를 내재화한다. 이후 고품질 B3LYP/TZVP 데이터(QMe14S)로 워밍 스타트 미세조정을 진행하는데, 여기서 Fidelity‑aware Feature Modulation(FAFM) 메커니즘이 핵심 역할을 한다. FAFM은 이론·기저집합을 나타내는 도메인 임베딩 d를 통해 스케일(g_d)과 시프트(b_d) 파라미터를 학습하고, 기존 피처 h에 곱·덧셈 연산으로 적용한다. 이 방식은 전체 네트워크를 재학습하지 않고도 이론 간 보정 효과를 제공해, 다중 레벨(저‑고) 양자화학 전이에서 효율적인 파인튜닝을 가능하게 한다.
성능 평가에서는 RDKit·ETKDG, xTB, Auto3D, UMA 등 기존 베이스라인과 비교해 전원 원자 RMSD가 로그 스케일에서 10⁻³ Å 이하로 크게 우위에 있다. 특히 결합 길이·각·이면각 별 오차 분석에서 모든 항목이 0.01 Å·0.5° 이하로 수렴한다. 에너지 측면에서도 B3LYP/TZVP 단일점 에너지 차이가 평균 0.02 kcal/mol 미만으로, 실질적인 DFT 재계산이 필요 없는 수준이다. DFT 수렴 테스트에서는 “All‑YES” 비율이 65 %(느슨한 기준)와 33 %(기본 기준)로, 기존 방법이 0 %에 머물던 것을 크게 앞선다. 이는 초기 구조가 전자밀도 수렴 조건을 만족하도록 이미 최적화된 형태임을 의미한다.
추가 실험에서는 분자 복잡도(원자 수, 회전 결합 수)와 에너지 스케일링이 부드럽게 증가함을 확인했으며, 전하·극성 등 전자적 특성(예: 쌍극자 모멘트)도 원본 DFT와 높은 상관관계를 보였다. 이러한 결과는 GeoOpt-Net이 물리적 일관성을 유지하면서도 데이터 기반 일반화를 달성했음을 시사한다.
전반적으로 GeoOpt-Net은 (1) SE(3) 등가성을 통한 물리적 제약, (2) 다중 브랜치 구조로 결합·각·이면각을 독립적으로 학습, (3) 이론·기저집합 인식을 위한 FAFM 기반 파인튜닝이라는 세 가지 핵심 설계 원칙을 결합해, 고품질 DFT 구조를 단일 추론 단계에서 제공한다. 이는 고처리량 가상 스크리닝, 약물 설계, 촉매 탐색 등 대규모 양자화학 워크플로우에서 최적화 비용을 획기적으로 절감하고, 재현성을 높이는 실용적 솔루션으로 평가된다.
댓글 및 학술 토론
Loading comments...
의견 남기기