인공 해마 알고리즘 AHA로 구현하는 원샷 에피소드 학습
AHA는 해마의 기능을 모방한 생물학적 타당성을 갖는 모델로, 라벨 없이 한 번의 경험만으로 패턴 분리·완성·재현을 수행한다. Omniglot 기반 확장 벤치마크에서 기존 딥 CNN과 비슷한 정확도를 보이며, 장기 기억(LTM)과 단기 기억(STM) 간의 상호작용을 통해 지속 학습 가능성을 제시한다.
저자: Gideon Kowadlo, Abdelrahman Ahmed, David Rawlinson
본 논문은 동물의 에피소드 학습 능력을 인공 지능에 도입하고자, 해마의 구조와 기능을 모방한 ‘Artificial Hippocampal Algorithm(AHA)’을 제안한다. 서론에서는 현재 대부분의 머신러닝이 대규모 라벨링된 데이터와 i.i.d. 가정 하에 느린 통계적 학습에 의존한다는 점을 비판하고, 동물은 단일 경험만으로도 구체적인 에피소드를 기억하고, 이를 기존 개념과 결합해 일반화와 지속 학습을 수행한다는 점을 강조한다. 이러한 차이를 설명하기 위해 보완 학습 시스템(Complementary Learning Systems, CLS) 이론을 소개하고, 해마가 단기 기억(STM)과 장기 기억(LTM) 사이의 교량 역할을 수행한다는 기존 연구들을 정리한다.
이어지는 ‘동기와 해결책’ 섹션에서는 기존 CLS 모델이 신경 수준에서 매우 세밀하게 구현돼 확장성에 한계가 있음을 지적한다. 특히, 패턴 분리와 패턴 완성이라는 해마의 핵심 기능을 동시에 구현하면서도 실제 이미지와 같은 고차원 센서 데이터를 처리하기는 어려웠다. 이를 극복하기 위해 저자들은 (1) 생물학적 타당성을 유지하되, 서브필드 수준에서 추상화한 모델을 설계하고, (2) 라벨 없이 학습할 수 있는 로컬 신호 기반의 얕은 역전파(두 층 이하) 규칙을 적용하였다.
‘모델’ 장에서는 AHA의 구조를 상세히 설명한다. 입력은 엔트로리날 피질(EC in)에서 시작해, 희소하고 중첩된 패턴으로 변환된 뒤, 치아상 회(DG)를 거쳐 더욱 희소화된다. DG‑CA3(머시 섬유) 연결은 비연관적(non‑associative) 플라스틱으로 작동해, CA3에 새로운 엔그램을 강하게 인코딩한다. CA3 내부의 재귀 연결은 자동 연관 메모리 역할을 하여, 부분적인 입력이 주어져도 전체 패턴을 복원한다(패턴 완성). EC‑CA3 연결은 EC와 CA3 사이의 연관성을 학습해, 유사한 입력이 동일한 엔그램을 불러오게 함으로써 일반화 능력을 제공한다. 마지막으로 EC‑CA1‑EC 경로를 통해 복원된 패턴이 EC out으로 전달되고, 이는 neocortex(장기 기억)와의 피드백을 통해 재생(replay) 및 통합된다.
학습 과정은 두 단계로 나뉜다. 인코딩 단계에서는 DG에서 강한 시냅스 전달이 CA3에 새로운 엔그램을 형성하고, EC‑CA3 연결이 동시에 학습된다. 이때 사용되는 학습 규칙은 로컬 오류 신호에 기반한 Hebbian‑like 업데이트이며, 역전파는 EC‑CA3와 CA3‑CA1 사이, 즉 최대 두 층에만 적용된다. 검색 단계에서는 약한 EC‑CA3 큐가 제공되면, CA3의 재귀 회로가 전체 패턴을 회복하고, CA1을 통해 EC out으로 전달한다. 이렇게 복원된 패턴은 LTM에 재생되어 장기 기억으로 전이된다.
실험 설계는 기존 Omniglot 1‑shot 분류 테스트를 확장한 새로운 벤치마크를 제안한다. 확장된 벤치마크는 (1) 패턴 분리 테스트(유사 문자 구분), (2) 패턴 완성 테스트(노이즈·가림이 있는 입력 복원), (3) 원본 입력 재현 테스트를 포함한다. AHA는 동일한 모델 구성으로 이 세 가지 과제를 모두 수행한다. 비교 대상으로는 (a) LTM 단독(전통적인 CNN)과 (b) 표준 STM(단순 메모리 모듈)이 사용되었으며, AHA는 특히 패턴 완성·재현에서 현저히 높은 정확도(≈95 %)를 기록했다. 기본 Omniglot 1‑shot 분류에서도 라벨이 없고 얕은 학습만을 사용했음에도 불구하고 최신 메타‑러닝 모델들과 비슷한 수준의 성능을 보였다.
또한, AHA와 LTM의 결합 실험에서는 AHA가 인코딩한 엔그램을 주기적으로 LTM에 재생함으로써, 기존 딥러닝 모델이 겪는 ‘재앙적 망각’ 문제를 완화한다는 결과를 제시한다. 이는 해마‑신피질 간의 상호작용을 모방한 구조가 지속 학습(lifelong learning)에도 유용함을 시사한다.
결론에서는 AHA가 (1) 라벨 프리 원샷 학습, (2) 해마의 핵심 기능인 패턴 분리·완성·재현을 하나의 모델에 통합, (3) 얕은 로컬 학습 규칙을 통해 생물학적 plausibility를 유지, (4) 기존 딥 CNN과 경쟁 가능한 성능을 보이며, (5) 장기 기억과의 연계로 지속 학습 가능성을 제공한다는 점을 강조한다. 향후 연구 방향으로는 더 복잡한 공간‑시간 연속성 학습, 멀티모달 입력 처리, 그리고 실제 로봇 시스템에의 적용 가능성을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기