증명가능한 물질 안전 인증 머신러닝 인터페이스 포텐셜 검증
초록
본 논문은 머신러닝 기반 원자간 포텐셜(MLIP)의 신뢰성을 검증하기 위해 ‘Proof‑Carrying Materials(PCM)’라는 3단계 프레임워크를 제안한다. 적대적 조합 탐색, 부트스트랩 기반 신뢰 구간 정제, Lean 4 형식 검증을 순차적으로 수행해 기존 단일 MLIP 필터가 93 % 놓치는 DFT‑안정 물질을 회복한다. CHGNet, TensorNet, MACE 세 모델을 대상으로 한 실험에서 아키텍처별 블라인스팟이 거의 독립적이며, 발견된 위험 특성을 이용한 위험 모델은 미보증 물질에 대해 AUC‑ROC ≈ 0.94의 높은 예측력을 보인다. 열전재료 스크리닝 사례에서도 PCM‑감사 프로토콜이 25 % 더 많은 안정 물질을 발굴한다.
상세 분석
논문은 고속 물질 탐색 파이프라인에서 MLIP가 형식적인 안전 보증 없이 사용되는 현상을 비판하고, 이를 ‘증명가능한 안전’ 개념으로 재구성한다. PCM은 (1) 적대적 위조(adversarial falsification) 단계에서 무작위, 휴리스틱, 라틴 하이퍼큐브, Sobol, LHS, 대형 언어 모델(LLM) 등 여섯 가지 전략을 통해 조합 공간을 탐색한다. 각 전략은 200번의 쿼리 예산 내에서 가능한 한 많은 ‘반례(counterexample)’를 찾아내며, 특히 LLM 기반 적대자는 고원자 번호·다원소 영역에 집중해 기능적으로 중요한 36개의 새로운 실패 사례를 발견한다. (2) 부트스트랩 신뢰 구간(envelope refinement) 단계에서는 발견된 반례를 이용해 95 % 신뢰 구간을 계산, 기존 전체 구간 대비 20배 이상 좁은 ‘안전 구간’(≈97개 물질)을 만든다. 이는 전통적인 conformal prediction이 전 영역에 균등하게 구간을 넓히는 것과 대조된다. (3) Lean 4 형식 검증 단계에서는 물리적 공리(에너지 보존, 힘 연속성 등)를 명시하고, 정제된 구간을 증명으로 컴파일한다. 이 과정은 완전 자동화되어 기계가 검증 가능한 증명을 생성한다. 실험에서는 CHGNet, TensorNet, MACE 세 모델을 5 000개의 WBM 구조에 적용했으며, 힘 오류 임계값 50 eV/Å를 초과하는 비율이 각각 31 %, 76 %, 73 %로 크게 차이나는 것을 확인했다. 특히 세 모델 간의 힘 상관계수 r이 0.13 이하로 거의 독립적이며, 실패 화학계가 거의 겹치지 않아 아키텍처 자체가 위험 패턴을 결정한다는 결론을 도출한다. 또한 전통적인 불확실성 추정(perturbation‑based UQ)은 조합 실패와 r = 0.039로 거의 무관함을 보여, 구조적 UQ와 조합적 적대 테스트가 서로 보완적인 정보원을 제공함을 입증한다. 발견된 위험 특성을 기반으로 훈련된 위험 모델은 미보증 물질에 대해 AUC‑ROC = 0.938 ± 0.004, 상위 20 % 위험 물질에 대해 정밀도 1.0을 달성한다. 교차‑MLIP 전이 실험에서도 CHGNet 기반 모델이 MACE 실패를 0.70 수준으로 예측했으며, 특성 중요도 상관계수 r = 0.877을 기록했다. 최종 사례 연구인 열전재료 스크리닝에서는 PCM‑감사 파이프라인이 기존 단일 MLIP 스크리닝에 비해 62개의 추가 안정 물질(전체 25 % 증가)을 발견했다. 전체 감사 비용은 $18 이하이며, 가장 효율적인 LLM 전략은 $0.05 수준의 비용으로 17개의 고유 물질을 찾아낸다. 이러한 결과는 ‘단일 모델에 의존하는 고속 스크리닝은 신뢰성 위험을 내재한다’는 경고와 함께, 다중 모델·적대·형식 검증을 결합한 PCM이 실용적인 안전 보증 수단이 될 수 있음을 보여준다.
댓글 및 학술 토론
Loading comments...
의견 남기기