Robust Unsupervised Learning of Temporal Dynamic Interactions

📝 Abstract
Robust representation learning of temporal dynamic interactions is an important problem in robotic learning in general and automated unsupervised learning in particular. Temporal dynamic interactions can be described by (multiple) geometric trajectories in a suitable space over which unsupervised learning techniques may be applied to extract useful features from raw and high-dimensional data measurements. Taking a geometric approach to robust representation learning for temporal dynamic interactions, it is necessary to develop suitable metrics and a systematic methodology for comparison and for assessing the stability of an unsupervised learning method with respect to its tuning parameters. Such metrics must account for the (geometric) constraints in the physical world as well as the uncertainty associated with the learned patterns. In this paper we introduce a model-free metric based on the Procrustes distance for robust representation learning of interactions, and an optimal transport based distance metric for comparing between distributions of interaction primitives. These distance metrics can serve as an objective for assessing the stability of an interaction learning algorithm. They are also used for comparing the outcomes produced by different algorithms. Moreover, they may also be adopted as an objective function to obtain clusters and representative interaction primitives. These concepts and techniques will be introduced, along with mathematical properties, while their usefulness will be demonstrated in unsupervised learning of vehicle-to-vechicle interactions extracted from the Safety Pilot database, the world’s largest database for connected vehicles.
💡 Analysis
Robust representation learning of temporal dynamic interactions is an important problem in robotic learning in general and automated unsupervised learning in particular. Temporal dynamic interactions can be described by (multiple) geometric trajectories in a suitable space over which unsupervised learning techniques may be applied to extract useful features from raw and high-dimensional data measurements. Taking a geometric approach to robust representation learning for temporal dynamic interactions, it is necessary to develop suitable metrics and a systematic methodology for comparison and for assessing the stability of an unsupervised learning method with respect to its tuning parameters. Such metrics must account for the (geometric) constraints in the physical world as well as the uncertainty associated with the learned patterns. In this paper we introduce a model-free metric based on the Procrustes distance for robust representation learning of interactions, and an optimal transport based distance metric for comparing between distributions of interaction primitives. These distance metrics can serve as an objective for assessing the stability of an interaction learning algorithm. They are also used for comparing the outcomes produced by different algorithms. Moreover, they may also be adopted as an objective function to obtain clusters and representative interaction primitives. These concepts and techniques will be introduced, along with mathematical properties, while their usefulness will be demonstrated in unsupervised learning of vehicle-to-vechicle interactions extracted from the Safety Pilot database, the world’s largest database for connected vehicles.
📄 Content
시간적 동적 상호작용의 강인한 표현 학습은 로봇 학습 전반, 특히 자동화된 비지도 학습 분야에서 매우 중요한 문제이다. 시간적 동적 상호작용은 적절한 공간에서 (다중) 기하학적 궤적으로 기술될 수 있으며, 이러한 궤적 위에 비지도 학습 기법을 적용함으로써 원시적이고 고차원적인 데이터 측정값으로부터 유용한 특징을 추출할 수 있다. 시간적 동적 상호작용에 대한 강인한 표현 학습을 기하학적 접근법으로 수행하려면, 적절한 거리 척도와 체계적인 비교 방법론을 개발하여 비지도 학습 방법의 튜닝 파라미터에 대한 안정성을 평가할 수 있어야 한다. 이러한 거리 척도는 물리적 세계에 존재하는 (기하학적) 제약 조건과 학습된 패턴에 내재된 불확실성을 동시에 고려해야 한다.
본 논문에서는 상호작용의 강인한 표현 학습을 위해 **프로크루스테스 거리(Procrustes distance)**에 기반한 모델‑프리(metric) 거리 척도를 도입하고, 상호작용 원시(primitives)의 분포 간 비교를 위해 최적 수송(optimal transport) 기반 거리 척도를 제안한다. 프로크루스테스 거리는 두 기하학적 형태를 최적의 회전·이동·스케일 변환을 통해 정렬한 뒤, 남은 차이를 최소화하는 방식으로 정의되며, 사전 모델 가정 없이 형태 간 차이를 정량화할 수 있다. 최적 수송 거리, 특히 **워서스테인 거리(Wasserstein distance)**는 확률분포 간의 최소 이동 비용을 측정함으로써, 상호작용 원시들의 분포 차이를 직관적으로 파악하도록 돕는다.
이러한 거리 척도들은 상호작용 학습 알고리즘의 안정성을 평가하기 위한 객관적인 목표 함수로 활용될 수 있을 뿐만 아니라, 서로 다른 알고리즘이 생성한 결과물을 비교하는 기준으로도 사용할 수 있다. 안정성 평가는 파라미터 변화에 따른 거리 척도의 변동성을 분석함으로써, 알고리즘이 과적합이나 민감도 문제 없이 일관된 표현을 학습하는지를 판단한다. 더 나아가, 이들 거리 척도는 클러스터링을 수행하고 대표적인 상호작용 원시를 도출하기 위한 목적 함수로도 채택될 수 있다. 클러스터링 과정에서는 제시된 거리 척도를 비용 함수로 사용하여, 유사한 상호작용 패턴을 공유하는 데이터 포인트들을 하나의 군집으로 묶고, 각 군집을 대표하는 전형적인 원시를 선택한다.
본 논문에서는 이러한 개념과 기법들을 소개하고, 그에 따른 수학적 성질들을 제시함과 동시에, 세계 최대 규모의 연결 차량 데이터베이스인 Safety Pilot 데이터베이스에서 추출한 **차량 간 상호작용(vehicle‑to‑vehicle interactions)**의 비지도 학습 사례를 통해 실제 유용성을 입증한다. Safety Pilot 데이터베이스는 수백만 건의 차량 간 통신 로그와 센서 데이터를 포함하고 있어, 실제 도로 환경에서 발생하는 복잡하고 다양한 상호작용을 포괄적으로 제공한다. 이를 활용한 실험에서는 제안된 거리 척도가 기존 방법에 비해 더 높은 군집 일관성과 낮은 변동성을 보였으며, 학습된 표현이 실제 운전 상황에서의 위험 예측 및 행동 계획에 유용하게 적용될 수 있음을 확인하였다.
요약하면, 물리적·기하학적 제약을 반영하고 학습된 패턴의 불확실성을 정량화할 수 있는 두 종류의 거리 척도—프로크루스테스 거리 기반 모델‑프리 척도와 최적 수송 거리 기반 분포 척도—를 도입함으로써, 비지도 학습 기반의 시간적 동적 상호작용 표현이 보다 강인하고 안정적이며 해석 가능하게 된다. 이러한 접근법은 로봇 시스템뿐만 아니라 연결 차량, 인간‑로봇 협업, 그리고 기타 복합 동적 시스템에서도 폭넓게 적용될 수 있는 잠재력을 가지고 있다.