인지지도 학습 기반 로봇 팔 제어
본 논문은 인지지도 학습자(CML)를 활용해 2차원 평면에서 다관절 로봇 팔을 제어하는 방법을 제시한다. 목표 좌표를 분수 거듭제곱 인코딩(FPE)으로 표현한 위상 하이퍼벡터를 공명기 네트워크 혹은 현대식 호프필드 네트워크로 분해해 각 관절의 각도를 얻고, 각 관절별 CML에 입력해 역기구학 없이 목표점에 도달한다.
저자: Nathan McDonald, Colyn Seeley, Christian Brazeau
본 논문은 인지지도 학습자(CML)와 초고차원 컴퓨팅(HDC)을 결합해 다관절 로봇 팔을 제어하는 새로운 프레임워크를 제안한다. 서론에서는 기존 딥러닝 기반 로봇 제어가 단일 모델에 의존하고 재학습이 필요하다는 문제점을 지적하고, 모듈식 학습 구조의 필요성을 강조한다. CML은 노드 상태(S), 엣지 액션(A), 액션 가용성(G) 세 가지 행렬로 구성된 그래프 탐색 모듈이며, 현재 상태와 목표 상태만으로 경로를 계획한다. 이때 노드와 엣지는 하이퍼벡터 형태로 표현되며, 차원 d≥512를 사용해 거의 정규 직교성을 확보한다.
목표점 인코딩 단계에서는 2차원 좌표 (a,b)를 복소 위상 벡터 x, y에 각각 a, b 제곱해 만든 위상 하이퍼벡터 p = x^a ⊙ y^b 로 변환한다. FPE는 위상 곱이 지수의 덧셈에 해당하므로 좌표 연산을 선형적으로 결합할 수 있다. 각 관절은 m개의 이산 각도(예: m‑root of unity)로 제한되며, 각도마다 동일한 x, y 기반으로 위상 하이퍼벡터를 사전 계산한다. 이렇게 구성된 코드북은 관절별 CML이 공유한다.
다음으로 p를 각 관절 코드북의 요소들로 분해한다. 두 가지 분해 알고리즘을 사용한다. (1) 공명기 네트워크는 각 코드북에 대한 추정 벡터를 교차 교정하며, 반복마다 목표 하이퍼벡터와 현재 추정값을 곱해 새로운 추정을 만든다. 수십 회 반복 후 유사도가 안정되면 수렴한다. (2) 현대식 호프필드 네트워크는 소프트맥스와 에너지 최소화 원리를 이용해 한 번의 업데이트로 거의 최적의 패턴을 복원한다. 두 방법 모두 50회 이하 재시작과 임계값 감소 전략을 통해 실패를 최소화한다.
분해된 각도 벡터는 각각 해당 관절 CML에 목표 상태(s_d)로 입력된다. CML은 현재 각도(s_t)와 목표 각도 사이의 최적 경로를 자체적으로 계획해 순차적으로 움직인다. 모든 관절이 병렬로 동작하므로 로봇 팔 끝점은 목표 좌표에 임의의 정밀도로 접근한다. 3차원 제어는 회전 베이스 하나와 2차원 평면상의 다관절 구조를 결합해 구현했으며, 회전 비가환성을 고려해 원형 CML을 별도로 설계했다.
실험에서는 n=3인 2D 팔과 회전 베이스를 가진 3D 팔에 대해 다양한 목표점에 대한 성공률과 수렴 속도를 평가했다. 결과는 1024 차원, m=11 각도 해상도에서 평균 0.96 이상의 유사도를 달성했으며, 공명기와 호프필드 모두 10~15회 반복 내에 수렴했다. 또한, 관절 수를 늘려도 추가 학습 없이 동일한 파이프라인으로 제어가 가능함을 보였다.
논의에서는 이산화된 각도 집합의 해상도와 하이퍼벡터 차원의 선택이 정확도와 연산 비용 사이의 트레이드오프를 만든다는 점, 3D 회전의 비가환성을 완전히 해결하기 위해서는 보다 복잡한 위상 인코딩이 필요함을 언급한다. 향후 연구 방향으로는 연속 각도 공간을 직접 다루는 고해상도 코드북 설계, 실시간 로봇 제어 시스템에의 통합, 그리고 다른 로봇 형태(예: 다족 보행 로봇)로의 확장을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기