합성 데이터에서 실제 모터 제어까지 인컨텍스트 학습으로 비선형 시스템 배우기
초록
본 논문은 트랜스포머 기반 모델을 이용해 합성 데이터로 사전 학습한 뒤, 몇 개의 실제 모터 입출력 예시만으로도 피드포워드 제어 신호를 생성하는 인컨텍스트 학습(ICL) 방식을 제안한다. 신호 표현과 시스템 행동을 분리한 두 단계 학습 구조와 대비 손실을 활용한 시스템 임베딩을 통해, 미조정된 한 쌍의 입력‑출력 데이터를 프롬프트로 사용해 새로운 모터와 부하에 대한 정확한 토크 전류를 예측한다. 실험 결과는 전통적인 PI 제어와 물리 기반 피드포워드 대비 RMSE가 현저히 낮으며, 보지 못한 부하·모터·두 관성 시스템에서도 좋은 일반화를 보인다.
상세 분석
이 연구는 인컨텍스트 학습을 물리 시스템 제어에 최초로 적용한 점에서 학술적·산업적 의의가 크다. 기존의 트랜스포머 기반 ICL 연구는 주로 함수 추론이나 언어 모델링에 머물렀지만, 본 논문은 연속적인 시계열 신호와 비선형 동역학을 동시에 다루는 새로운 프레임워크를 제시한다. 핵심 설계는 (1) 신호 표현 단계와 (2) 시스템 행동 단계로 명확히 구분한 두 단계 사전 학습이다. 신호 표현에는 Encodec 기반 인코더‑디코더를 사용해 입력·출력 파형을 길이에 독립적인 토큰 시퀀스로 압축한다. 이는 MSE 기반 재구성 손실로 학습되며, 0.0201의 평균 RMSE를 달성해 고품질의 압축 표현을 확보한다. 시스템 행동 단계에서는 두 개의 서브 블록이 작동한다. 첫 번째는 입력‑출력 토큰 쌍과 학습 가능한 시스템 토큰을 자기‑주의 메커니즘으로 처리해 시스템 임베딩 z를 추출한다. 여기서 대비 손실(contrastive loss)을 도입해 동일 시스템의 임베딩은 서로 가깝게, 다른 시스템은 멀게 배치하도록 학습한다. t‑SNE 시각화에서 LTI와 NTI, 그리고 필터 종류별로 명확히 구분되는 클러스터가 형성된 점은 임베딩이 시스템 특성을 효과적으로 포착함을 증명한다. 두 번째 서브 블록은 추출된 z와 목표 입력 x₂ 토큰을 결합해 출력 ŷ₂를 생성한다. 재구성 손실(L₂)과 대비 손실을 가중합한 공동 목표 함수는 임베딩이 실제 예측에 유용하도록 만든다.
다운스트림 적응 단계에서는 사전 학습된 두 모델을 고정하고, 시스템 행동 모델의 한 층만 20 epoch 정도 미세 조정한다. 이때 사용되는 프롬프트는 PI 제어만 적용된 ‘untuned’ 입출력 쌍이며, 목표는 물리 기반 피드포워드와 잘 튜닝된 PI 제어가 결합된 ‘well‑tuned’ 쌍을 재현하는 것이다. 실험에서는 다양한 모터(스테퍼, BLDC)와 부하(단일·두 관성) 상황을 설정했으며, 특히 chirp 파형을 프롬프트로 사용했을 때 가장 낮은 RMSE를 기록했다.
성능 비교에서는 전통적인 PI 제어와 물리 기반 피드포워드가 각각 1.363.64, 0.461.70의 RMSE를 보인 반면, 제안 모델은 0.45~1.13 수준으로 전반적으로 우수했다. 특히 보지 못한 부하·모터·두 관성 시스템에서도 성능 저하가 거의 없었으며, 이는 시스템 임베딩이 실제 물리적 변수를 추상화해 일반화 능력을 부여했기 때문이다.
추가적인 Ablation 연구에서는 (1) 2단계 사전 학습이 단일 엔드‑투‑엔드 학습보다 RMSE 1.13 vs 1.20으로 개선되었고, (2) NTI(비선형) 데이터를 포함한 사전 학습이 LTI 전용보다 모든 테스트 시나리오에서 더 낮은 오류를 보였지만, LTI 전용 모델도 여전히 베이스라인을 능가함을 확인했다. 이는 합성 데이터가 실제 시스템과 완벽히 일치하지 않아도 충분히 전이 학습에 활용될 수 있음을 시사한다.
전반적으로 이 논문은 (① 신호와 시스템을 분리한 모듈화 설계, ② 대비 손실 기반 시스템 임베딩, ③ 최소 데이터로 실시간 피드포워드 제어)라는 세 가지 핵심 기술을 결합해, 데이터 효율적인 물리 시스템 제어의 새로운 가능성을 열었다. 향후 복합 로봇 팔, 전력 전자 장치 등 다양한 비선형 동역학을 가진 분야에 적용될 잠재력이 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기