클리크플로머를 활용한 오프라인 재료 최적화
초록
본 논문은 전통적인 최대우도 기반 생성 모델이 재료 탐색에 한계를 보이는 문제를 해결하고자, 오프라인 모델 기반 최적화(MBO)와 클리크 구조를 결합한 새로운 프레임워크인 CliqueFlowmer를 제안한다. 변환기와 연속 정규화 흐름을 이용해 재료의 격자와 원자 정보를 고정 차원의 잠재 벡터로 인코딩하고, 클리크 분해를 통해 속성 예측 모델을 구성한다. 이후 클리크 기반 MBO로 잠재 공간을 직접 최적화해 목표 물성값을 최소화하고, 디코더를 통해 최적화된 재료를 복원한다. 실험 결과, Materials Project 데이터와 M3GNet·MEGNet 오라클을 사용한 평가에서 기존 생성 모델 대비 현저히 우수한 물성을 가진 후보를 발견한다.
상세 분석
CliqueFlowmer는 재료 과학에서 흔히 마주치는 이산‑연속 혼합 구조와 물리적 제약을 딥러닝 모델이 다루기 어려운 문제로 규정하고, 이를 해결하기 위해 네 가지 핵심 모듈을 설계한다. 첫 번째 Encoder는 격자 길이·각도, 원자 위치, 원자 종류라는 네 종류의 입력을 각각 전용 MLP와 임베딩 레이어로 변환한 뒤, 어댑티브 레이어 정규화(AdaLN)로 결합된 변환기(Transformer) 내부에 삽입한다. 변환기의 출력은 어텐션 기반 풀링을 통해 고정 차원( d_z )의 잠재 벡터 z 로 압축되며, 이 과정에서 풀링 쿼리 벡터가 학습되어 다양한 셀 크기에 대해 일관된 표현을 제공한다.
두 번째 Predictor는 z 를 클리크‑노드 구조로 재배열하여 N_clique × d_clique 형태의 행렬 Z 로 만든다. 각 클리크는 인접 클리크와 d_knot 차원을 공유하도록 설계돼 “스티칭(stitching)” 효과를 유도한다. 이렇게 구성된 Z 를 MLP에 입력하면 클리크별 기여를 합산한 형태로 목표 물성 f(M)을 근사한다. 클리크 분해는 기존 MBO 연구에서 최적화 효율을 크게 높인 것으로 알려져 있으며, 여기서는 재료의 불규칙한 토폴로지를 연속적인 라티스 구조로 매핑하는 핵심 브릿지 역할을 한다.
세 번째 Decoder는 원자 종류와 격자 기하학을 각각 별도 모듈로 복원한다. 원자 종류 디코더는 잠재 벡터 z 를 변환기 입력에 AdaLN 형태로 주입한 뒤, 인과적(causal) 변환기로 다음 토큰을 예측한다. Beam search를 통해 다중 후보를 생성함으로써 화학적 타당성을 유지한다. 격자 기하학 디코더는 연속 정규화 흐름(flow‑matching) 방식을 채택한다. 초기값을 사전 분포(p_0)에서 샘플링하고, 변환기 기반 속도 네트워크 V_θ 를 이용해 ODE를 적분함으로써 최종 격자와 원자 위치 G 를 복원한다. 이때 클리크 형태 Z 를 교차 어텐션에 삽입해 잠재 공간과 기하학 사이의 강한 연관성을 학습한다.
네 번째 Training 단계는 네 모듈을 공동 최적화한다. 인코더‑디코더는 변분 오토인코더(VAE) 손실(평균·분산 파라미터)과 원자 종류 로그우도, 흐름 손실(길이·각도·위치)로 구성된다. 흐름 손실은 각 물리량에 동일 가중치를 부여해 균형 잡힌 학습을 보장한다. 또한, 잠재 벡터를 일정 확률(p_lat=0.1)로 노이즈로 대체해 흐름 디노이저가 잠재 정보에 과도히 의존하지 않도록 한다. 전체 손실은 위 항들의 가중합으로 정의되며, Adam 옵티마이저로 학습한다.
실험에서는 Materials Project 데이터셋(수천 개의 결정 구조)과 M3GNet·MEGNet을 오라클로 사용해 전도성, 밴드갭, 열전도율 등 다양한 목표 물성을 최적화한다. CliqueFlowmer는 오프라인 MBO 루프를 5000번 수행했을 때, 기존 VAE·Diffusion·GAN 기반 베이스라인 대비 평균 물성 개선율이 30% 이상이며, 최상위 후보는 물성값이 베이스라인 최고값의 2배 이상을 초과한다. 또한, 생성된 구조는 화학적 타당성(전하 중성, 원자 거리 제한) 검증을 통과했으며, 일부는 실제 DFT 계산을 통해 재현 가능성이 확인되었다.
전반적으로 CliqueFlowmer는 (1) 재료의 복합적인 이산·연속 특성을 고정 차원 잠재 공간에 효율적으로 매핑, (2) 클리크 기반 MBO를 통해 잠재 공간을 직접 최적화, (3) 변환기와 흐름 모델을 결합해 물리적 제약을 자연스럽게 반영하는 설계가 돋보인다. 이 접근법은 향후 복잡한 물성(예: 촉매 활성, 전해질 안정성) 최적화에도 확장 가능하며, 오프라인 데이터만으로도 실험 비용을 크게 절감할 수 있는 실용적 길을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기