인공지능 기반 인과 모델로 물리 법칙 추론하기

본 논문은 인과 추론 기법을 활용해 물리 현상의 원인‑결과 관계를 자동으로 학습하고, 전통적인 상관관계 중심 머신러닝을 넘어 물리 법칙을 “이해”하도록 하는 방법론을 제시한다. 저자들은 DAG, PC·GES·LiNGAM 등 기존 인과 구조 학습 알고리즘과 DoWhy·CDT 라이브러리를 결합해 조석, 옴의 법칙, 광저항(LDR) 특성, 양자 얽힘 등 네 가지 사례를 실험한다. 결과는 인과 모델이 변수 간 인과성을 올바르게 식별하고, 개입(do‑연…

저자: Jorawar Singh, Kishor Bharti, Arvind

인공지능 기반 인과 모델로 물리 법칙 추론하기
본 논문은 인공지능(AI)과 머신러닝(ML)이 현재까지 주로 데이터의 상관관계를 탐색하고 복잡한 함수 근사에 머무르고 있다는 점을 비판하며, 물리학적 지식 획득을 위해서는 인과적 개입과 상상(‘what‑if’ 질문) 능력이 필수적이라고 주장한다. 이를 뒷받침하기 위해 Judea Pearl이 제시한 인과 사다리(연관‑개입‑반사실) 개념을 도입하고, 현재 대부분의 ML이 1단계(연관)만 수행한다는 점을 지적한다. 논문은 인과 구조를 명시적으로 모델링하기 위해 Directed Acyclic Graph(DAG)를 사용한다. DAG는 변수들을 노드로, 인과 관계를 방향성 있는 간선으로 표현한다. 저자들은 통계적 독립성 검정을 기반으로 하는 PC 알고리즘, 점진적 탐색을 통한 GES, 비가우시안 선형 모델에 특화된 LiNGAM 등 세 가지 주요 구조 학습 방법을 소개한다. 이러한 알고리즘들은 관측 데이터만으로 인과 그래프를 추정하지만, 마코프성, 충분성, 무루프성 등 몇 가지 가정을 전제로 한다. 구조 학습이 완료되면, 인과 효과를 정량화하기 위해 DoWhy와 Causal Discovery Toolkit(CDT) 라이브러리를 활용한다. DoWhy는 ‘do‑연산’(개입) 효과를 추정하는 프레임워크로, 백도어(back‑door) 조정, 프론트도어(front‑door) 조정, 도구 변수(instrumental variable), 매개 효과(mediation) 등 네 가지 식별 전략을 제공한다. 백도어 조정은 치료 변수와 결과 변수 사이의 모든 역방향 경로를 차단하는 변수 집합을 찾아 조건부 평균 효과를 계산한다. 프론트도어 조정은 매개 변수를 통해 전달되는 경로를 이용해 직접 효과를 추정한다. 도구 변수는 교란 변수를 직접 측정할 수 없을 때, 치료 변수와 독립적이며 결과에 직접 영향을 주지 않는 외부 변수를 활용한다. 매개 효과 분석은 치료가 결과에 미치는 직접 효과와 매개 변수를 통한 간접 효과를 분리한다. 네 가지 물리 사례를 통해 이 프레임워크의 적용 가능성을 검증한다. 1. **조석 높이**: 지구‑달 거리(d_EM)와 지구‑태양 거리(d_ES)를 독립 변수로, 네 개 지역(호놀룰루, 뭄바이, 리버풀, 핼리팩스)의 일일 최고 조수 높이(h)를 종속 변수로 설정한다. LiNGAM 기반 데이터‑주도 DAG는 d_EM → h 관계를 강하게 식별했으며, 이는 물리적 도메인 지식(달의 중력이 조석에 미치는 주요 원인)과 일치한다. 백도어 조정을 통해 d_EM의 평균 치료 효과(ATE)가 -2913.16~ -10045.83(단위: ft) 정도로, d_ES의 효과는 -2.20~ -22.15에 불과해 달의 영향이 압도적으로 크다는 결론을 얻었다. 2. **옴의 법칙**: 전압(V), 저항(R), 온도(T), 길이(L), 단면적(A) 등 물리량을 변수로 두고, 전류(I)를 결과 변수로 설정한다. 기존 물리학적 관계 I = V/R, R = ρ·L/A, ρ = ρ₀(1+αΔT)를 이용해 합성 데이터를 생성한다. 후보 인과 모델 중 ‘T → I’를 직접 연결한 모델과 ‘T → R → I’ 경로만을 포함한 모델을 비교한다. 백도어 조정 결과, T가 I에 직접적인 인과 효과를 갖는다는 증거는 없으며, 온도는 저항을 매개로 전류에 간접적으로 영향을 미친다는 기존 이론을 재확인한다. 3. **광저항(LDR) 특성**: 실험적으로 광량(L)과 저항(R)을 측정하고, 온도와 습도 등 잠재적 교란 변수를 포함한다. 인과 그래프는 L → R 경로와 온도 → R 경로를 포함한다. 도구 변수 기법으로 광량을 조작할 수 없는 경우(예: 실험실 조명 제어 한계) 온도 변수를 도구 변수로 활용해 L → R 효과를 추정한다. 결과는 광량이 저항에 미치는 직접 효과가 통계적으로 유의미함을 보여준다. 4. **양자 얽힘**: 두 입자 A, B의 측정 결과 X, Y를 변수로 두고, 숨은 변수(λ)와 측정 설정(θ_A, θ_B)을 포함한 인과 모델을 구성한다. 인과 그래프는 λ → X, λ → Y, θ_A → X, θ_B → Y 형태이며, λ는 비국소적 상관을 설명한다. 도구 변수(θ_A, θ_B)를 이용해 λ의 효과를 추정하고, 백도어 조정을 통해 λ이 실제로 X와 Y 사이의 상관을 매개한다는 것을 확인한다. 이는 Bell 부등식 위반을 인과론적 관점에서 해석하는 시도로, 기존 양자역학 해석과 보완적인 시각을 제공한다. 각 사례마다 모델의 견고성을 검증하기 위해 세 가지 리팩터 검증을 수행한다. (1) 무작위 공통 원인 추가 시 추정값 변동성 측정, (2) 위약 처리(무작위 변수로 치료 대체) 시 효과 소멸 확인, (3) 데이터 서브셋을 이용한 추정값 안정성 평가. 모든 검증에서 추정값 변동이 작아 인과 모델의 신뢰성을 뒷받침한다. 논문의 주요 기여는 다음과 같다. 첫째, 물리학 데이터에 인과 추론을 적용하는 전반적인 워크플로우를 제시하고, 기존 ML이 놓치기 쉬운 ‘왜’ 질문에 답할 수 있음을 보였다. 둘째, 인과 구조 학습과 도메인 지식의 결합이 물리 법칙 검증에 효과적임을 실증했다. 셋째, 인과 모델의 검증 절차(리팩터 검증)를 도입해 결과의 견고성을 정량화하였다. 하지만 한계도 명시한다. 인과 구조 학습 알고리즘은 선형·가우시안 가정에 민감하고, 비선형·다중 상호작용이 강한 시스템에서는 정확도가 떨어진다. 또한, 관측 데이터만으로는 완전한 DAG를 복원하기 어려워 전문가의 사전 지식이 필요하다. 데이터 양이 충분하지 않거나 노이즈가 큰 경우(특히 양자 실험)에는 인과 식별 자체가 불안정할 수 있다. 따라서 향후 연구는 비선형 인과 모델, 베이지안 구조 학습, 그리고 실험 설계와 결합한 하이브리드 접근을 탐색해야 한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기