향상된 결정 그래프 합성곱 신경망으로 재료 탐색 가속화
초록
본 논문은 기존 CGCNN 모델에 Voronoi 구조, 3‑body 상관관계, 최적화된 결합 표현을 추가한 iCGCNN을 제안한다. OQMD 180 k 데이터로 학습한 뒤 230 k 테스트에서 정확도가 20 % 향상됐으며, ThCr₂Si₂ 구조 탐색에서는 성공률이 31 %로 기존 대비 2.4배, 무작위 탐색 대비 310배 높았다. 132 600 후보 중 97개의 새로운 안정 물질을 발견해 고속 DFT 계산을 130배 가속했다.
상세 분석
iCGCNN은 기존 CGCNN이 갖는 한계를 체계적으로 보완한다. 첫째, Voronoi 테셀레이션을 이용해 각 원자 주변의 실제 공간 분할 정보를 그래프에 삽입함으로써, 원자 간 거리와 접촉 면적을 정량화한다. 이는 특히 비정규격 구조나 복합 결합 환경에서 중요한 역할을 한다. 둘째, 3‑body 상관관계를 명시적으로 모델링한다. 기존 CGCNN은 주로 2‑body(원자‑원자) 상호작용에 초점을 맞추었지만, 실제 결정에서는 삼중 결합 각도와 면적이 물성에 큰 영향을 미친다. iCGCNN은 각 이웃 삼중쌍에 대해 각도와 면적을 특징으로 포함시켜, 전자 구조와 결합 강도에 대한 더 풍부한 정보를 학습한다. 셋째, 화학 결합 표현을 최적화하였다. 원자 종류뿐 아니라 전기음성도 차이, 결합 차수, 전하 전이 가능성 등을 벡터화해 그래프 엣지에 부착함으로써, 동일 원소라도 결합 환경에 따라 다른 특성을 가질 수 있게 했다.
모델 아키텍처는 기존 CGCNN과 동일한 다중 합성곱 레이어와 풀링 구조를 유지하면서, 위 세 가지 추가 정보를 입력으로 받아 가중치를 학습한다. 학습 과정에서는 대규모 OQMD 데이터(180 k 학습, 20 k 검증)와 Adam 옵티마이저, 학습률 스케줄링, 조기 종료 등을 적용해 과적합을 방지하였다. 테스트 셋(230 k)에서 평균 절대 오차(MAE)가 기존 대비 20 % 감소했으며, 특히 열역학적 안정성(formation energy) 예측에서 R²가 0.94에서 0.96으로 향상되었다.
ThCr₂Si₂ 구조 탐색 사례에서는, iCGCNN이 132 600개의 원소 조합을 스코어링하고 상위 5 %만 DFT 계산에 투입했다. 결과적으로 757개의 DFT 계산으로 97개의 새로운 안정 물질을 확인했으며, 이는 무작위 고속 탐색 대비 130배 효율적인 결과다. 또한, 성공률 31 %는 기존 CGCNN(≈13 %)보다 2.4배 높아, 모델이 실제 실험적 합성 가능성을 잘 포착함을 보여준다.
이러한 결과는 iCGCNN이 복잡한 결정 구조와 다원소 시스템을 다룰 때, 물리적 의미를 갖는 구조적 정보를 그래프에 통합함으로써 예측 정확도와 탐색 효율을 동시에 끌어올릴 수 있음을 증명한다. 향후에는 전자 밴드 구조, 전도성, 열전도성 등 다양한 물성 예측에 확장하고, 활성 학습(active learning)과 결합해 실험-계산 사이클을 더욱 단축시키는 방향이 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기