인공지능의 자율적 발달과 인간 수준 학습을 위한 딥러닝 확장

초록

본 논문은 인간이 보이는 자율적 평생 학습 능력을 딥러닝에 통합하기 위한 핵심 메커니즘을 조명한다. 호기심·내재적 동기, 사회적 학습, 신체 구현 등 발달·인지 로보틱스에서 도출된 원리를 제시하고, 현재 딥러닝이 과제별 목표 함수를 수동 지정하고 대규모 오프라인 데이터를 필요로 하는 한계를 짚는다. 이러한 자율적 목표 설정과 점진적 커리큘럼 학습이 인간 수준의 효율적 학습을 가능하게 함을 논의한다.

상세 요약

논문은 인간 학습이 “자율적 목표 선택·내재적 동기·사회적 상호작용·신체적 실험”이라는 네 축으로 구성된다는 점을 강조한다. 첫 번째 축인 호기심과 내재적 동기는 강화학습에서의 탐험 보상 구조와 유사하지만, 인간은 목표 자체를 스스로 정의하고 그 복잡도를 점진적으로 증가시킨다. 이는 기존 딥러닝이 사전에 정의된 손실 함수와 고정된 데이터셋에 의존하는 방식과 근본적으로 다르다. 두 번째 축인 사회적 학습은 관찰, 모방, 언어적 교류를 통해 지식을 전이하고 압축한다는 점에서, 현재의 지도학습이 요구하는 대량 라벨링을 대체할 수 있는 효율적 메커니즘으로 해석된다. 세 번째 축인 구현(embodiment)은 물리적 세계와의 지속적 상호작용을 통해 인과 모델을 형성하고, 에너지·시간 제약 하에서 최적화된 행동 정책을 습득한다. 논문은 이러한 요소들을 통합한 “발달적 커리큘럼 학습”을 제안한다. 구체적으로, (1) 목표 생성 메커니즘을 메타‑강화학습으로 구현하고, (2) 사회적 신호(관찰, 언어, 제스처)를 멀티모달 인코더에 통합, (3) 물리 시뮬레이션 혹은 실제 로봇을 통한 온라인 업데이트를 통해 연속적인 모델 업데이트를 수행한다. 또한, 인간이 사용하는 “구성적(compositional) 표현”과 “선천적 사전지식(예: 직관적 물리·심리)”을 베이지안 구조 학습이나 그래프 신경망으로 형식화할 수 있음을 제시한다. 이러한 접근은 현재 딥러닝이 겪는 데이터 효율성·범용성·연속 학습 문제를 근본적으로 완화한다는 점에서 학문적·산업적 파급력이 크다.

초록

상세 요약

📜 논문 원문 (영문)