멀티모달 역설계 AI, MEIDNet으로 저밴드갭 페로브스카이트를 빠르게 찾아라
초록
MEIDNet은 구조‑전자‑열역학 3가지 모달리티를 대비학습(contrastive learning)으로 정렬하고, EGNN 기반 구조 인코더와 커리큘럼 학습을 결합해 잠재공간 탐색 효율을 60배 향상시킨다. Perovskite‑5 데이터셋을 이용해 저밴드갭(0.8–1.5 eV)·안정적인 140개의 후보를 생성했으며, 그 중 19개가 기존 데이터에 없고 에너지 헐(E_hull) < 100 meV를 만족해 SUN 비율 13.6 %를 달성했다.
상세 분석
MEIDNet은 기존 단일모달 생성 모델(VAE, GAN, Diffusion)과 달리 구조, 전자(밴드갭), 열역학(형성엔탈피) 세 가지 정보를 동시에 학습한다. 구조 인코더는 E(3)‑equivariant Graph Neural Network(EGNN)를 사용해 원자 좌표와 특성을 회전·반사·노드 순열에 불변하게 변환한다. EGNN는 메시지 패싱, 특성 업데이트, 좌표 업데이트 세 단계로 구성되며, 128차원의 잠재벡터가 재구성 정확도와 연산 비용 사이의 최적점을 제공한다.
세 모달리티는 각각 EGNN(구조)와 두 개의 MLP(밴드갭, 형성엔탈피)로 128‑차원 임베딩으로 변환된다. 이후 InfoNCE 손실을 이용한 대비학습으로 같은 물질의 세 임베딩이 서로 가깝게, 다른 물질은 멀게 배치된다. 저자는 초기 학습 단계에서 대비 손실 가중치를 0→1로 점진적으로 증가시키는 커리큘럼 학습(Curriculum Learning, CL)을 적용했으며, 이는 구조 재구성 손실이 우선 학습되도록 하여 전체 학습 효율을 약 60배 가속화한다.
다중 모달 정렬 전략은 ‘조기 융합(Early Fusion, EF)’과 ‘지연 융합(Late Fusion, LF)’으로 비교되었다. LF는 구조‑특성 매칭률(SM)≈66 %에 비해 잠재공간 정렬(CS≈0.31, L2D≈1.06)이 낮았다. EF는 정렬(CS≈0.89, L2D≈0.45)은 좋지만 SM≈32 %로 재구성 품질이 떨어졌다. EF+CL은 두 지표를 모두 최적화해 SM≈66 %와 CS≈0.91, L2D≈0.40을 달성했다. 이는 초기 단계에서 구조 학습을 강조하고, 이후에 스칼라 특성 학습을 진행함으로써 모달리티 간 간섭을 최소화한 결과이다.
잠재공간 정렬이 충분히 이루어지면 역설계 파이프라인이 가능해진다. 목표 밴드갭(0.8–1.5 eV)과 음의 형성엔탈피를 조건으로 잠재벡터를 최적화하고, 최적화된 벡터를 디코더에 입력해 결정구조를 복원한다. 복원된 구조는 eSEN‑30M‑OAM 모델을 통해 에너지 헐을 빠르게 평가하고, 최종적으로 VASP DFT 계산으로 검증한다. 140개의 후보 중 19개가 에너지 헐 < 100 meV이며, 학습 데이터에 존재하지 않는 새로운 조성을 보여 SUN 비율 13.6 %를 기록한다. 이는 기존 멀티모달 모델(FTCP < 5 %, CDV‑AE ≈ 18 %)보다 현저히 높은 수치이며, 단일모달 생성 모델(MatterGen ≈ 39 %)에 근접한다.
또한, 밴드갭 예측 정확도는 CGCNN을 이용해 MAE ≈ 0.02 eV를 달성했지만, DFT(PBE) 계산에서는 목표값보다 낮게 나오는데, 이는 학습 데이터의 밴드갭 분포 편향, 새로운 조성에 대한 데이터 부족, 그리고 PBE 자체의 저밴드갭 경향이 복합적으로 작용한 결과로 해석된다.
전체적으로 MEIDNet은 (1) EGNN 기반 구조 인코딩으로 물리적 대칭성을 보존, (2) 대비학습과 커리큘럼 학습을 결합해 효율적인 잠재공간 정렬, (3) 조기 융합에 커리큘럼을 적용해 재구성 품질과 정렬을 동시에 최적화, (4) 역설계 파이프라인을 통해 목표 물성에 부합하는 새로운 물질을 자동 생성 및 검증하는 전 과정을 구현한다. 이는 멀티모달 학습이 재료 과학에서 실제 설계 도구로 전환될 수 있음을 실증적으로 보여준다.
댓글 및 학술 토론
Loading comments...
의견 남기기