구조 안정성을 위한 효과적 정보 기준
초록
본 논문은 심볼릭 회귀에서 단순히 정확도와 복잡도만을 고려하는 기존 패러다임의 한계를 지적하고, 물리 법칙이 보여주는 구조적 안정성을 모방한 새로운 평가 지표인 Effective Information Criterion(EIC)를 제안한다. EIC는 수식의 연산 트리를 정보 채널로 모델링해 내재된 반올림 잡음이 재귀 계산 과정에서 얼마나 증폭되는지를 정량화함으로써, 인간이 직관적으로 선호하는 물리적으로 타당한 구조와 병렬적으로 비합리적인 구조를 구분한다. 실험에서는 인간이 만든 공식과 기존 SR 알고리즘이 도출한 공식 사이에 뚜렷한 구조적 안정성 격차가 존재함을 확인하고, EIC를 검색 목표 혹은 사전학습 필터링에 통합했을 때 정확도·복잡도 파레토 전선이 크게 개선되고, 샘플 효율성이 2‑4배, 일반화 R²가 22.4% 상승함을 보였다. 또한 108명의 전문가 평가에서 EIC가 인간 선호와 70% 일치함을 입증하였다.
상세 분석
본 연구는 심볼릭 회귀(SR)의 핵심 문제를 두 가지 관점에서 재조명한다. 첫째, 기존 SR은 정확도와 복잡도(주로 기호 수)만을 목표로 삼아, 수식 내부의 연산 구조가 물리적 타당성을 갖는지 여부를 간과한다. 저자들은 실제 물리 법칙이 낮은 정밀도(예: 슬라이드 룰)에서도 안정적으로 동작한다는 점에 착안해, “구조적 안정성”을 새로운 품질 척도로 정의한다. 둘째, 이 구조적 안정성을 정량화하기 위해 수식을 계산 트리로 보고, 각 연산 노드에서 발생하는 반올림 잡음을 독립적인 곱셈형 노이즈(ε_k)로 모델링한다. 이를 기반으로 각 노드 k에 대해 누적 오차 η_k의 분산 증폭 계수 s_k²(x)를 도출하고, 재귀식 s_k² = 1 + Σ_i κ_{k,i}²·s_i² 로 계산한다. 여기서 κ_{k,i}는 연산 e_k의 상대 조건수이며, 수식 구조만으로 s_k를 구할 수 있다는 점이 핵심이다. 최종 EIC는 트리 전체에서 가장 큰 평균 s_k 값을 로그 스케일로 변환한 값, 즉 max_k log₁₀ \bar{s}_k 로 정의된다. 이 정의는 (1) 파라미터 프리(σ에 의존하지 않음), (2) 단위 스케일에 무관(조건수가 무차원), (3) 대수적 변형에 민감(불필요한 연산이 있으면 EIC가 상승)이라는 세 가지 이론적 장점을 가진다.
실험에서는 133개의 인간이 만든 물리 공식(Feynman, Strogatz)과 17개의 최신 SR 알고리즘이 생성한 1330여 개의 후보식을 비교했다. 결과는 인간 공식이 EIC < 1 수준의 높은 구조적 안정성을 보이는 반면, SR 결과는 종종 EIC가 6~8에 달해 실질적인 유효 유효숫자 손실을 초래함을 보여준다. 이러한 격차를 해소하기 위해 두 가지 적용 방안을 제시한다. 첫째, 진화 기반 검색에서 목표 함수에 EIC 페널티를 추가하면, 파레토 전선이 정확도·복잡도뿐 아니라 구조적 안정성까지 포함하는 3차원 최적화 문제로 전환되어, 더 신뢰성 있는 공식이 도출된다. 둘째, 생성 모델(Transformer) 사전학습 시 EIC가 높은 합성 공식을 필터링하면, 학습 데이터의 물리적 일관성이 크게 향상되어 샘플 효율성이 2‑4배, 테스트 R²가 22.4% 상승한다. 마지막으로 108명의 도메인 전문가에게 동일한 공식 쌍을 제시했을 때, EIC가 높은 쪽을 70%의 비율로 선호한다는 인간 평가와의 높은 상관성을 보고한다.
이 논문의 주요 기여는 (1) 구조적 안정성을 정량화하는 새로운 무파라미터 지표 EIC를 제안, (2) EIC가 기존 복잡도 지표와는 독립적으로 물리적 타당성을 평가함을 증명, (3) EIC를 검색 및 생성 파이프라인에 통합함으로써 SR의 실용성을 크게 향상시킨다. 또한, EIC는 단순히 “짧은 공식이 좋다”는 경험법칙을 넘어, 실제 연산 과정에서 발생할 수 있는 수치 불안정을 사전에 차단하는 메커니즘을 제공한다는 점에서, 과학적 발견을 지원하는 차세대 SR 프레임워크의 핵심 구성 요소로 자리매김할 가능성이 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기