기억이 만든 시간 왜곡과 미래 선택

본 논문은 인간·동물의 시간 왜곡 현상과 인터템포럴 선택에서 나타나는 미래 할인 현상을, 센서모터 상호작용을 코딩 효율성 관점에서 재해석한다. 저자들은 에이전트와 환경 사이의 상호작용을 이산 시간·이산 상태의 확률 과정으로 표현하고, 에이전트의 메모리 상태를 과거와 미래 사이의 최소 충분 통계량(sufficient statistic)으로 정의한다. 이때 예측 정보 I(Xₚ;X𝒻) 는 과거 데이터가 미래를 예측하는 데 필요한 비트 수이며, 이는 샤논 엔트로피 −log p와 직접 연결된다. 다음 단계에서는 자유 에너지 원리를 도입한다. 자유 에너지 F(xₚ) 는 기대 보상 R(x𝒻|xₚ) 와 메모리 비용(KL‑다이버전스) 사이의 트레이드오프를 최적화하는 함수이며, β(역온도) 파라미터가 메모리 비용의 상대적 저렴함을 조절한다. 최적화된 사후분포 P(x𝒻|xₚ) 는 Gibbs 형태를 띠어, 과거가 미래 보상을 얼마나 증가시키는지를 확률적으로 반영한다. 이 식을 변형하면 로그 확률과 보상이 선형 관계에 있음을 알 수 있어, “과거가 미래 보상을 높이면 미래가 더 가능해진다”는 직관을 정량화한다. 이론적 모델을 검증하기 위해 저자들은 다중 팔 밴드잇 환경을 시뮬레이션한다. 네 종류의 에이전트를 설정했는데, 각각은 (1) 사전 지식이 완전한 ‘정보드’ 에이전트, (2) 유한 파라미터 집합을 갖는 ‘유한’ 에이전트, (3) 파라메트릭 모델을 사용하는 ‘파라메트릭’ 에이전트, (4) 무한 차원의 비모수 모델을 사용하는 ‘비모수’ 에이전트이다. 모든 에이전트는 Thompson 샘플링을 통해 행동을 선택한다. 시뮬레이션 결과는 다음과 같다. 1. **시간 지각**: 에이전트가 미래를 예측하기 위해 사용한 메모리 양이 클수록(특히 비모수 모델) 사건의 주관적 지속시간이 길어졌다. 이는 예측 정보가 크게 증가했기 때문이며, ‘놀랍지만 보상이 큰’ 사건이 실제 인간 실험에서 시간 확대를 일으키는 현상과 일치한다. 2. **할인 함수**: 메모리 제약이 약한 정보드와 유한 모델은 할인율이 일정한 지수형(시간에 대해 일정한 감쇠) 함수를 보였다. 파라메트릭 모델은 중간 정도의 메모리 제한으로 인해 할인율이 점차 감소하는 하이퍼볼릭 형태를 나타냈으며, 비모수 모델은 메모리 비용이 크게 부과되어 초기 급감 후 완만한 감소를 보이는 전형적인 하이퍼볼릭 곡선을 재현했다. 3. **β 파라미터 효과**: β를 크게 하면 메모리 비용이 저렴해져 에이전트는 더 많은 정보를 저장하고, 결과적으로 시간 인식이 늘어나고 할인율이 완만해진다. 반대로 β가 작으면 메모리 비용이 비싸져 시간 압축과 급격한 할인 현상이 나타난다. 이러한 결과는 “시간 인식과 인터템포럴 선택은 동일한 메모리‑보상 최적화 문제의 두 측면”이라는 핵심 가설을 뒷받침한다. 기존 연구가 내부 시계, 주의력, 혹은 심리물리학적 법칙에 의존했던 것과 달리, 본 논문은 순수히 통계적·정보론적 관점에서 시간 왜곡과 할인 현상을 설명한다. 또한, 기억 용량이 제한된 상황(예: 스트레스, 인지 부하)에서 인간이 시간을 ‘압축’하거나 ‘확장’하는 메커니즘을 정량화할 수 있는 이론적 틀을 제공한다. 결론적으로, 기억(예측 정보)의 효율적 코딩이 주관적 시간과 미래 가치 평가를 동시에 형성한다는 점을 밝혀냈으며, 이는 인지과학, 행동경제학, 인공지능 분야에서 인간·기계의 의사결정 모델을 통합적으로 설계하는 데 중요한 통찰을 제공한다.

기억이 만든 시간 왜곡과 미래 선택

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기