“목표에 따라 리드·헤딩을 전환한다: ‘가능하면 리드, 필요하면 헤드’ 알고리즘 재구성”
📝 Abstract
Designing systems for autonomous transport of groups of living agents has received a lot of attention in recent years due to a wealth of important potential applications. Biomimetic approaches are often sought, and a range of herding algorithms, inspired by how dogs herd sheep, as well as leadership algorithms mimicking leader-follower systems, have been introduced. However, they suffer from a common problem: shepherding algorithms require that agents evade the shepherd, and leading algorithms require that agents follow. This can cause problems in real-world applications where the behavioral responses of the agents to a transporter are likely to be heterogeneous over both long and short timescales. Here, we introduce an algorithm that adaptively switches between leading and herding depending on the response it receives from the agents to mitigate this problem. We show via simulation that this mixed algorithm can transport groups with any follower and evader composition, and we compare its performance with lead-only and herd-only algorithms. We also show that the mixed algorithm can deal with groups where individual agents randomly switch their strategy over time, as long as sufficient time is provided to complete the task relative to the switching rate. Given that our algorithm overcomes issues associated with herd-only and lead-only algorithms and might also, as a side effect, mitigate the issue of habituation to robotic transporters, it takes us one step closer to realizing many of the proposed applications for these types of algorithms.
💡 Analysis
**
1. 연구 배경 및 필요성
- 생물모방(biomimicry) 접근이 로봇 집단 운반 분야에서 활발히 사용되고 있으나, 기존 연구는 ‘목양’ 혹은 ‘리더십’ 중 하나에만 초점을 맞추었다.
- 실제 동물 군집은 **이질적(heterogeneous)**이며, 시간에 따라 행동이 변(habituation, stochastic switching)한다. 이러한 변동성을 무시하면 로봇 시스템의 실용성이 크게 저하된다.
2. 핵심 아이디어
- 동적 모드 전환: 로봇(transporter)이 가장 가까운 개체의 거리 변화를 모니터링해 “접근(approaching)”이면 리드 모드, “멀어짐(receding)”이면 헤드 모드로 전환한다.
- 전략 독립성: 로봇은 개체들의 전략(팔로워/회피자) 을 사전에 알 필요가 없으며, 오직 거리 변화만으로 판단한다. 이는 시스템 복잡도를 최소화한다.
3. 모델 및 구현
| 요소 | 기존 목양 모델(
📄 Content
그룹을 특정 위치로 안내하거나 이끌어 가는 행위는 동물계 전반에 걸쳐 정기적으로 수행되는 과제이다[1,2]. 영장류가 무리를 먹이 찾는 장소로 이끄는 경우[3]부터 양치기 개가 양떼를 몰아 가는 경우[4,5]까지, 혹은 개미가 둥지 이동 중 동족을 안내하거나 운반하는 경우[6,7]에 이르기까지 다양하다. 이러한 현상을 이해하는 일은 생물학적 관심사일 뿐만 아니라, 무생물 혹은 살아있는 개체들을 운반할 수 있는 자율 시스템이 야생동물 보전, 환경 정화, 가축 관리, 군중 제어, 대피, 다중 로봇 협동 등 광범위한 응용 가능성을 가지고 있기 때문에 공학적 관심사이기도 하다[8][9][10][11][12][13][14][15][16][17][18][19][20].
이에 따라 생체모방(biomimetic) 접근법을 이용한 집단 운반 연구가 활발히 진행되고 있으며, 최근 대부분의 연구는 양치기 개의 행동에서 영감을 얻은 양치기(herding) 방식에 초점을 맞추고 있다[21]. 수많은 양치기 알고리즘이 시뮬레이션에서 검토되었으며[13,22‑28], 일부는 무생물 혹은 살아있는 개체를 운반하는 로봇 플랫폼에 구현되었다[29‑31]. 리더십에 의한 운반도 탐구되었고[32], 로봇 리더가 다양한 동물 시스템에서 추종 행동을 유도한다는 것이 입증되었다[33,34]. 특정 상황에서는 효과적이지만, 두 접근법 모두 근본적인 제한점을 가진다: 양치기는 운반자를 회피하도록 만들고, 리더십은 운반자를 따라오게 만든다.
자연계 집단에서는 개체들이 이질적이고 상황에 따라 달라지는 행동 반응을 보이는 경우가 흔하다[35]. 이러한 반응은 시간에 따라 습관화(habituation)로 변할 수도 있으며[30], 순수한 양치기 혹은 리더 기반 전략의 효율성을 저해한다. 두 가지 방식 외에도, “가능하면 리드하고, 필요하면 강제·운반·양치기” 라는 혼합 전략이 일부 개미 종의 둥지 이동 과정에서 관찰되었다[7]. 이와 같은 생체모방적 대안은 아직 살아있는 개체의 자율 집단 운반 맥락에서 충분히 고려되지 않았으며, 제안된 여러 응용 분야에 큰 잠재력을 가지고 있다[8].
동시에, 이질성을 명시적으로 다루는 연구도 점차 늘어나고 있다[36‑40]. 이러한 연구들은 반응성, 사회적 친밀도, 행동 규칙 집합의 차이를 고려함으로써 특정 형태의 이질성에 대한 통찰을 제공한다. 그러나 대부분은 기존 양치기 구조 위에 점점 더 특수화된 제어 규칙을 겹쳐 놓는 방식에 의존한다. 대조적인 생체모방적 관점은, 자연에서 강인한 운반이 점진적인 복잡성보다는 단순한 상호작용 메커니즘에서 비롯된다는 점이다. 이는 이전 양치기 모델에서도 명시적으로 활용된 바 있다[25]. 따라서 다양한 운반 상황에 맞춰 개발된 양치기 알고리즘[13,22,27,28]에 대체 운반 모드를 통합하면, 불응하거나 반응이 가변적인 개체들을 운반하는 데 있어 보다 견고한 해결책과 이론적 통찰을 동시에 얻을 수 있다.
제안된 알고리즘
본 연구에서는 운반자가 개체들의 반응에 따라 양치기와 리드 모드를 적응적으로 전환하는 알고리즘을 제시한다. 구체적으로는 기존 양치기 모델[25]에 ‘lead’ 모드를 추가하고, 운반자는 ‘herding’ 모드에서 ‘lead’ 모드로 자동·적응적으로 전환한다. 또, (양과 같은) 개체들은 ‘follow’ 혹은 ‘evade’ 두 전략 중 하나를 채택하도록 하며, p라는 파라미터를 도입해 그룹 내 추종자 비율을 나타낸다.
- p = 0 (추종자 전무) → 새 알고리즘은 기존 양치기 알고리즘[25]과 동일.
- p = 1 (전부 추종자) → 운반자는 오직 ‘lead’ 모드만 사용.
- 0 < p < 1 → 운반자는 ‘mixed’ 전략을 사용한다. 즉, 최소 한 명이라도 추종자가 있으면 ‘lead’를, 추종자가 없으면 ‘herding’을 수행한다.
또한, π라는 파라미터를 도입해 각 개체가 매 타임스텝마다 전략을 전환할 확률을 정의한다.
시뮬레이션 결과
1) 고정된 비율(p)에서의 성능 비교
p를 0부터 1까지 0.1 간격으로 변화시키며 시뮬레이션을 수행하고, 완료 시간과 목표에 도달한 개체 비율을 측정하였다.
- Mixed 알고리즘은 모든 p ∈ [0,1] 구간에서 할당된 시간 내에 모든 개체를 성공적으로 목표에 도달시켰다(그림 1A‑B).
- Herd‑only 알고리즘은 오직 p = 0 (전부 회피자)일 때만 성공했다. 추종자가 존재하면 운반자는 효과적인 구동 위치를 유지할 수 없었다.
- Lead‑only 알고리즘은 p = 1 (전부 추종자)일 때만 성공했다. 회피자가 섞여 있으면 운반자는 추종자를 목표로 이끌 수는 있지만, 회피자를 끌어당길 수 없었다.
Mixed 알고리즘은 **‘추종자가 최소 하나라도 있으면 리드하고, 없으면 양치기’**라는 전환 로직을 통해 두 실패 모드를 모두 회피한다. 즉, 먼저 추종자를 목표로 이끌고, 남은 회피자를 양치기 방식으로 몰아간다.
2) 시간에 따라 전략이 변하는 경우
각 개체가 π 확률로 매 타임스텝마다 전략을 전환하도록 설정하였다.
- π ≤ 0.01 (타임스텝당 1 % 이하)에서는 Mixed 알고리즘이 고정된 시간 제한(6000 타임스텝) 내에 모든 개체를 목표에 도달시켰다(그림 1C).
- π가 더 커지면 고정 시간 제한이 부족해 성공률이 감소한다.
- 시간 제한을 없애고 충분히 긴 시뮬레이션을 진행하면, π가 0.5(매 타임스텝마다 평균 절반의 개체가 전략을 바꿈)와 같은 높은 전환율에서도 결국 모든 개체를 목표에 도달시킨다(그림 1D).
논의
1) 실용적 의의
무생물·생물 개체의 자율 집단 운반을 위한 생체모방 솔루션은 다양한 응용 분야에서 큰 가치를 가진다[8]. 기존 대부분의 알고리즘은 양치기에 기반하고[21], 일부는 리드에 의존한다[1,2]. 그러나 두 접근법 모두 행동 이질성—특히 회피자와 추종자가 혼합된 그룹이나 시간이 지나면서 전략이 변하는 경우—에 취약하다. 본 연구는 **‘가능하면 리드하고, 필요하면 양치기’**라는 자연계 전략을 알고리즘에 통합함으로써 이러한 문제를 완화한다.
2) 습관화와 스트레스
로봇에 의한 양치기의 또 다른 문제는 습관화이다. 초기에는 회피하던 개체가 시간이 지나면서 회피 행동을 멈추면 양치기 전용 알고리즘은 작동을 멈춘다[30]. Mixed 전략은 다음과 같은 방식으로 습관화를 완화하거나 활용할 수 있다.
- 불명확한 반응을 보이는 경우에도 리드와 양치기를 번갈아 시도함으로써 로봇의 행동을 예측하기 어렵게 만들어 습관화를 지연시킨다.
- 실제로 개체가 리드에 반응한다면, 비용이 높은 양치기 모드를 사용하지 않아도 된다.
양치기는 공포 반응에 기반하므로 스트레스와 부상의 위험이 증가한다[41]. 반면, 리드는 동물 복지를 향상시킬 가능성이 있다. 실제로 몇몇 동물은 로봇을 따라가도록 훈련될 수 있으며[33,34], 양치기 개가 양떼를 리드하는 사례도 보고되었다[42]. 따라서 Mixed 전략은 실제 현장에서 적용 가능성이 높다.
3) 다양한 동기와 적용 가능성
‘Lead’ 모드는 개체가 리더를 따르는 동기(예: 리더십 인식)와 위협을 피하려는 동기(예: 드론을 쫓는 행동) 모두에 적용될 수 있다. 예를 들어, 해양새가 드론을 향해 추격·집단 공격(mobbing) 행동을 보이는 경우[43]에도 이 메커니즘을 ‘리드’로 활용할 수 있다.
4) 시뮬레이션 기반 연구와 실제 구현
본 연구 결과는 시뮬레이션을 통해 얻었으며, 이는 이질적·시간 변동적인 개체 반응을 체계적으로 탐색할 수 있게 한다. 그러나 기존 연구에서 간단한 로봇 플랫폼에 구현된 양치기 메커니즘이 충분한 시간 동안 동적 조건에서도 물체를 견고히 운반·재배열함이 입증된 바 있다[31].
5) 향후 연구 방향
‘Herd‑only’와 ‘Lead‑only’ 접근법의 한계를 고려할 때, 새로운 집단 운반 알고리즘이 필요하다. 특히, 내재·외재 노이즈뿐 아니라 전략 차이(습관화, 행동 이질성 등)에 강인한 알고리즘이 요구된다[30,35]. 최근 연구들은 사회적 친밀도[36,37], 운반자에 대한 반응성[38,40], 행동 규칙 집합[39] 등 특정 이질성을 다루기 위해 맞춤형 제어 요소를 추가하고 있다. 이러한 접근은 중요한 기여이지만, 특정 시나리오에 국한되고 제어 복잡성을 증가시킨다.
우리의 ‘가능하면 리드하고, 필요하면 양치기’ 접근은 단순한 전환 메커니즘만을 도입함으로써 이질성 축(운반자를 끌어당기거나 회피하는 여부)을 자연계 전략에 맞게 포괄한다. 계산 관점에서 보면, 이 적응형 전환은 기존 양치기 알고리즘 대비 거의 부가 비용이 없으며, 가장 가까운 개체의 상대적 움직임 방향만 감지하면 된다. 이는 그룹 규모에 비례해 증가하는 연산량을 요구하지 않는다.
궁극적으로 우리는 ‘제3 물결’(third‑wave) 생체모방 운반 알고리즘의 초기 단계로서, 다양한 이질적 행동 반응에 대해 효과를 유지하면서 기존 특화 접근법을 보완·확장할 수 있는 기반을 제시한다.
모델 확장 상세 설명
1) 원래 양치기 모델([25])
- N개의 양과 같은 개체가 단일 양치기에 의해 목표 지점으로 몰린다.
- 양치기의 위치를 Sₜ, 개체 i의 위치를 Aᵢ,ₜ라 하자.
- 양치기로부터 거리 rₛ보다 멀리 있는 개체는 작은 무작위 움직임을 수행하고, rₛ 이내에 있으면 양치기로부터 반발하고, n개의 가장 가까운 이웃의 무게중심을 향해 끌린다.
- 짧은 거리에서의 개체‑개체 반발도 포함된다.
- 이러한 상호작용 하에 개체 i의 t+1 시점 헤딩 Hᵢ,ₜ₊₁은
[
이 글은 AI가 자동 번역 및 요약한 내용입니다.