가우시안 프로세스 회귀 기반 지식 증류로 에폭시 폴리머 물성 동시 예측

본 연구는 실험 문헌에서 수집한 236개의 데이터 포인트를 활용해, 가우시안 프로세스 회귀(GPR)를 교사 모델로, 다중 물성을 동시에 예측하는 신경망 학생 모델을 학습시키는 지식 증류(KD) 프레임워크를 제안한다. 레진·경화제의 SMILES 기반 분자 기술자를 RDKit으로 추출하고, 비율·경화 온도·시험 조건 등 공정 파라미터와 결합해 입력 피처로 사용한다. 교사 GPR은 각 물성별 비선형 매핑을 학습하고, 학생 신경망은 물성 라벨을 원‑핫…

저자: Sindu B. S., Jan Hamaekers

가우시안 프로세스 회귀 기반 지식 증류로 에폭시 폴리머 물성 동시 예측
본 논문은 에폭시 열경화성 폴리머의 물성을 예측하기 위해, 실험 문헌에서 수집한 236개의 데이터 포인트(레진 9종, 경화제 40종, 다양한 비율·경화 온도·시험 조건 포함)를 기반으로 새로운 머신러닝 프레임워크를 제시한다. 기존 연구들은 주로 시뮬레이션 데이터에 의존하거나 단일 물성(예: Tg)만을 대상으로 했으며, 데이터가 부족하거나 화학 구조가 복잡한 열경화성 수지에 적용하기 어려웠다. 이를 극복하기 위해 저자들은 두 단계의 모델링 전략을 설계하였다. 첫 번째 단계는 물성별 독립적인 가우시안 프로세스 회귀(GPR) 모델을 교사(teacher)로 활용하는 것이다. GPR은 베이지안 회귀 특성상 작은 데이터에서도 과적합을 방지하고, 예측 불확실성을 제공한다. 각 물성(유리전이온도, 밀도, 탄성계수, 인장강도, 압축강도, 굽힘강도, 파괴에너지, 접착강도)에 대해 선형, RBF, Matérn, 상수 커널 및 이들의 가산 조합을 포함한 광범위한 커널 공간을 그리드 서치와 5‑fold 교차검증으로 탐색하였다. 최적 하이퍼파라미터(α, ℓ, σ_n 등)를 찾은 뒤, 교사 모델은 전체 입력 공간에 대해 “소프트 타깃”(soft target) 예측값을 생성한다. 두 번째 단계는 이러한 소프트 타깃과 실제 실험값을 동시에 손실 함수에 포함하는 지식 증류(KD) 방식을 적용한 신경망 학생 모델을 구축하는 것이다. 학생 모델은 입력 피처와 함께 목표 물성을 원‑핫 인코딩한 벡터를 결합하여, 하나의 네트워크가 9가지 물성을 동시에 예측하도록 설계되었다. 네트워크는 입력층, 두 개의 은닉층(ReLU 활성화), 출력층으로 구성되며, Adam 옵티마이저(학습률 1e‑3, 배치 크기 32)로 5000 epoch 학습한다. 손실 함수는 L_KD = α·MSE(예측, 소프트 타깃) + (1‑α)·MSE(예측, 실제) 형태이며, α = 0.7을 사용해 교사 예측에 높은 가중치를 부여한다. 입력 피처 설계에서도 중요한 차별점을 둔다. 레진·경화제의 화학 구조를 SMILES 문자열로 표현하고, 이를 RDKit을 이용해 28개의 분자 수준 기술자(분자량, 원자 종류·수, 결합 종류, 기능기 그룹, 고리 수, 전자 수 등)로 변환한다. 기존의 단순 라벨링 방식 대신 이러한 물리‑화학적 특성을 사용함으로써, 모델이 화학적 지식을 직접 학습하도록 만든다. 특히 두 종류의 경화제가 동시에 사용되는 경우, 각각의 기술자를 모두 포함한다. 모든 연속형 피처는 Min–Max 스케일링으로 0~1 사이로 정규화한다. 성능 평가는 기존 머신러닝 모델(P‑LS, Ridge, Kernel Ridge, Random Forest, Gradient Boosting, k‑Nearest Neighbour, 기본 GPR)과 비교하였다. 동일한 피처 세트를 사용했으며, 평가 지표는 평균 절대 오차(MAE)와 결정계수(R²)이다. 인포메드 GPR‑KD 프레임워크는 모든 물성에서 MAE를 최소 15 % 이상 감소시켰고, R²는 0.89 이상으로 일관된 고성능을 보였다. 특히 유리전이온도 예측에서 물리‑화학적 기술자를 포함한 경우 MAE가 0.42 °C까지 낮아졌으며, 이는 기존 모델 대비 22 % 개선된 수치이다. 다중 물성 동시 예측의 효과도 실험적으로 검증하였다. 동일한 네트워크를 사용해 9가지 물성을 한 번에 예측했을 때와 각각 별도 모델을 학습했을 때의 MAE 차이를 비교한 결과, 다중‑태스크 설정이 평균 8 % 더 낮은 MAE를 기록했다. 이는 물성 간 상관관계를 활용한 정규화 효과와 데이터 효율성 향상에 기인한다. 또한 추론 속도 측면에서 학생 신경망은 전체 물성을 한 번에 출력하므로, 개별 GPR 9개를 순차적으로 실행하는 경우에 비해 약 5배 빠른 응답성을 제공한다. 논문의 한계로는 데이터 규모가 236점에 불과해 고차원 피처와 비교했을 때 차원 저주 위험이 존재한다는 점을 들었다. 저자들은 향후 데이터베이스 확대와 베이지안 최적화 기반 하이퍼파라미터 탐색을 통해 모델의 견고성을 강화할 계획이라고 밝힌다. 결론적으로, 본 연구는 가우시안 프로세스 회귀와 지식 증류를 결합한 프레임워크를 통해 에폭시 폴리머의 물성을 높은 정확도와 빠른 속도로 동시에 예측한다. 물성 간 상관관계를 활용한 다중‑태스크 학습과 분자 수준 기술자를 통한 물리‑화학적 인포메이션 통합은 기존 방법을 크게 능가한다. 이 접근법은 실험 비용을 절감하고, 새로운 에폭시 조성의 설계·최적화를 가속화하는 강력한 도구로 활용될 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기