고압 고온 실리콘 구조 탐색을 위한 다항식 머신러닝 포텐셜
초록
본 연구는 다항식 회전 불변량을 기반으로 한 머신러닝 포텐셜(MLP)을 개발하고, 이를 이용해 0 ~ 100 GPa, 0 ~ 1000 K 범위의 실리콘 결정구조를 전역 탐색한다. 고압·고온 조건에서도 높은 예측 정확도를 유지하도록 데이터셋을 확장하고, 반복적인 RSS‑MLP 학습 과정을 통해 최적 모델을 얻는다. 이후 획득한 로컬 최소구조에 대해 자기일관성 포논(SSCHA) 계산을 수행해 자유에너지와 상안정성을 평가하고, 압력‑온도 상도(phase diagram)를 제시한다. 제안된 워크플로우는 기존 MLP 대비 에너지·힘 오차가 크게 감소했으며, 실리콘의 알려진 다중 상을 정확히 재현한다.
상세 분석
이 논문은 다항식 머신러닝 포텐셜(Polynomial MLP)의 이론적 기반과 실용적 구현을 두 단계로 나누어 상세히 설명한다. 첫 번째 단계는 회전 불변량을 생성하기 위한 구조 특징(d(i)_m)의 정의와, 이를 다항식 형태로 결합하는 방법이다. 저자들은 구형조화함수와 가우시안 형태의 반경 함수 f_n(r) 를 이용해 원자 주변의 밀도 분포를 a(i)_nlm 으로 표현하고, 이를 다중 차수(p)까지 곱셈 결합해 불변량 d(i)_nl1…lp(σ) 를 만든다. 이러한 불변량은 그룹 이론적 투영 연산자를 통해 회전 대칭을 보존하도록 설계되었으며, 선형 회귀를 이용한 가중치 w 를 최적화한다.
두 번째 단계에서는 기존 단일 다항식 MLP의 표현력 한계를 보완하기 위해 하이브리드 모델을 도입한다. 서로 다른 절단 반경, 최대 각운동량(l_max), 다항식 차수(p) 등을 파라미터로 하는 두 개의 서브 모델을 합산함으로써, 짧은 거리와 긴 거리 상호작용을 동시에 포착한다. 이 접근법은 선형 회귀의 계산 효율성을 유지하면서도 피처 공간을 효과적으로 확장한다.
데이터셋 구축 과정도 핵심적인 혁신을 포함한다. 기존에 12,000개의 구조로 구성된 dataset 1은 주로 0 GPa에서 최적화된 프로토타입을 기반으로 하여 고압 영역에서의 일반화 능력이 부족했다. 이를 보완하기 위해 86개의 프로토타입을 25, 50, 75, 100 GPa에서 각각 최적화하고, 각 구조에 대해 무작위 격자 팽창·왜곡·원자 변위를 적용해 4,000개의 고압 후보 구조를 생성하였다. 이후 구조 선택 알고리즘(Ref. 62)을 사용해 대표성을 갖는 샘플을 추출, dataset 2(≈16,000 구조)로 통합하였다. 학습‑검증 분할은 90:10 비율로 수행되었으며, PBE‑PAW 기반 DFT 계산은 400 eV 절단 에너지와 0.09 Å⁻¹ k‑점 간격을 사용해 높은 정확도를 확보하였다.
MLP의 성능 평가는 에너지 RMSE, 힘 RMSE, 응력 RMSE 등 다중 지표로 수행되었다. 하이브리드 모델은 단일 모델 대비 에너지 오차를 약 30 % 감소시켰으며, 특히 50 ~ 100 GPa 구간에서 힘 예측 정확도가 크게 향상되었다. 이러한 고정밀 포텐셜을 바탕으로 Random Structure Search(RSS)를 진행하면, 압력별 전역 최소구조와 다수의 메타스테이블 구조를 효율적으로 탐색할 수 있다.
전역 탐색 후 얻어진 로컬 최소구조에 대해 자기일관성 포논(SSCHA) 계산을 수행한다. SSCHA는 고차 비조화 효과를 포함한 자유에너지 계산을 가능하게 하며, 특히 저온에서 동역학적으로 불안정한 구조가 고온에서 안정화되는 현상을 포착한다. 저자들은 SSCHA를 수천 개의 구조에 대해 자동화된 파이프라인으로 적용했으며, 계산 비용을 최소화하기 위해 MLP 기반 힘과 히스테리시스 보정 기법을 도입하였다. 결과적으로 압력‑온도 상도는 실리콘의 알려진 일곱 상(다이아몬드, β‑Sn, Imma, Simple Hexagonal, Cmce, HCP, FCC)을 정확히 재현했으며, 새로운 메타스테이블 후보도 제시하였다.
전체 워크플로우는 (1) 고압·고온을 포괄하는 DFT 데이터셋 구축, (2) 하이브리드 다항식 MLP 학습, (3) RSS 기반 전역 구조 탐색, (4) SSCHA를 통한 자유에너지 및 상안정성 평가의 네 단계로 구성된다. 각 단계는 기존 방법론 대비 높은 효율성과 정확성을 보이며, 특히 고압 분야에서 MLP와 SSCHA의 결합이 실험적 검증이 어려운 영역의 상도 예측에 강력한 도구가 될 수 있음을 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기