인간처럼 배우고 사고하는 기계 만들기
이 논문은 현재 딥러닝 기반 AI가 인간 수준의 성과를 보이지만, 인과 모델 구축, 직관적 물리·심리 이론, 구성성 및 메타학습 등 인간 학습의 핵심 메커니즘을 결여하고 있음을 지적한다. 저자들은 인간과 같은 학습·사고 기계를 만들기 위해 (a) 세계의 인과 구조를 모델링하고 설명할 수 있어야 하고, (b) 직관적 물리와 심리 이론에 기반한 사전 지식을 갖춰야 하며, (c) 구성성과 학습‑to‑learn 능력으로 새로운 상황에 빠르게 일반화해야…
저자: Brenden M. Lake, Tomer D. Ullman, Joshua B. Tenenbaum
이 논문은 “인간처럼 배우고 사고하는 기계”를 만들기 위한 이론적·실험적 기반을 종합적으로 검토하고, 현재 딥러닝 기반 AI가 인간 지능과 근본적으로 다른 점을 명확히 밝힌다. 서론에서는 최근 딥러닝이 이미지 인식, 음성 인식, 강화학습 등 다양한 분야에서 인간 수준 혹은 초월적인 성과를 거두었지만, 이러한 성공이 ‘뇌‑유사’라는 표면적 유사성에만 의존하고 있음을 지적한다. 저자들은 인간 지능을 이해하기 위해 인지과학, 발달심리학, 그리고 AI 연구의 교차점을 탐색한다.
첫 번째 핵심은 **인과 모델 구축**이다. 인간은 관찰된 현상을 단순히 통계적으로 예측하는 것이 아니라, 그 뒤에 숨은 원인·결과 관계를 모델링한다. 이러한 인과 모델은 설명, 추론, 가설 검증, 그리고 새로운 상황에 대한 일반화에 필수적이다. 논문은 인과 그래프, 구조적 베이지안 네트워크, 그리고 프로그래밍 언어 기반의 확률적 프로그램을 통해 인과 모델을 학습하고 활용하는 최신 연구들을 소개한다. 또한, 모델‑프리 강화학습이 빠른 행동 선택에 강점이 있지만, 인과 모델이 없으면 장기적 계획과 설명 능력이 제한된다는 점을 강조한다.
두 번째 핵심은 **직관적 물리학과 직관적 심리학**이라는 선천적·조기 발달 이론이다. 영아는 물체 영속성, 중력, 충돌 등 물리적 법칙을 기본적으로 이해하고, 타인의 목표와 믿음을 추론하는 ‘마음 이론’을 갖는다. 이러한 선험적 지식은 새로운 과제에서 데이터 효율성을 크게 높인다. 논문은 물리 시뮬레이터(예: 물리 엔진)와 사회적 시뮬레이터를 사전 학습에 활용해 신경망이 이러한 직관을 내재하도록 하는 방법을 제시한다. 구체적으로, 물리 기반 예측 모델을 학습시키는 ‘예측 손실(prediction loss)’이나, 에이전트가 다른 에이전트의 행동을 관찰해 목표를 추론하도록 하는 ‘이론‑마음(Theory‑of‑Mind) 네트워크’를 소개한다.
세 번째 핵심은 **구성성(compositionality)과 학습‑to‑learn(meta‑learning)**이다. 인간은 복잡한 개념을 작은 프리미티브(예: 색, 형태, 동작)들의 조합으로 표현하고, 이를 재조합해 새로운 상황에 적용한다. 메타학습은 이전 과제에서 얻은 구조적 지식을 새로운 과제에 빠르게 전이한다. 논문은 최근의 메타학습 알고리즘(MAML, Reptile), 프로토타입 네트워크, 그리고 프로그램 인덕션(Neural Programmer‑Interpreters, probabilistic program synthesis) 등을 검토한다. 특히, 프로그램 인덕션은 ‘프로그래밍 언어’라는 강력한 구조적 편향을 제공해, 작은 데이터에서도 복잡한 함수와 규칙을 학습할 수 있게 한다.
이러한 세 가지 요소를 통합한 **하이브리드 아키텍처**를 제안한다. 구체적으로, (1) 저수준 감각 입력을 처리하는 딥 CNN/Transformer 모듈, (2) 인과 구조를 학습하고 추론하는 베이지안 그래프 네트워크, (3) 물리·심리 시뮬레이터와 연결된 사전 지식 모듈, (4) 메타학습 기반의 파라미터 초기화와 구성성 기반 모듈 조합기를 결합한다. 이 구조는 모델‑프리 방식의 빠른 반응성과 모델‑베이스드 방식의 깊은 추론을 동시에 제공한다.
논문은 또한 **구체적 연구 과제**를 제시한다. 첫째, 인간 수준의 ‘왜’와 ‘어떻게’를 설명할 수 있는 인과 모델을 자동으로 생성·수정하는 알고리즘 개발. 둘째, 물리·심리 시뮬레이터를 활용해 사전 학습된 직관적 이론을 신경망에 통합하는 방법론 연구. 셋째, 구성성을 활용한 모듈식 네트워크 설계와 메타학습을 결합해 적은 샘플로 새로운 작업을 학습하는 실험. 넷째, 모델‑프리와 모델‑베이스드 강화학습을 혼합해 실시간 의사결정과 장기 계획을 동시에 달성하는 하이브리드 강화학습 프레임워크 구축.
결론에서는 인간 지능이 ‘예측’보다 ‘설명’에 초점을 맞추는 점을 강조하고, AI가 진정한 일반지능으로 나아가기 위해서는 단순히 더 큰 데이터와 더 깊은 네트워크가 아니라, 인지과학이 밝혀낸 구조적·인과적 원리를 알고리즘에 내재시켜야 함을 역설한다. 이러한 방향은 앞으로 AI가 인간과 협업하고, 인간이 이해할 수 있는 방식으로 의사결정을 내리며, 새로운 환경에 빠르게 적응하는 데 필수적이다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기