자유비행을 위한 최소시간 수렴 궤적 생성 및 신경망 기반 실시간 안내
초록
본 논문은 선행 항공기의 궤적을 최소 시간에 따라 추종하도록 설계된 상대 유도 방식을 제안한다. 최적 수렴 궤적은 최대 은행각 회전과 직선 구간으로 구성되는 ‘정규 궤적’으로 분석되며, 역동적 프로그래밍을 이용해 대량의 최적 궤적 데이터를 생성한다. 이 데이터를 학습한 피드포워드 신경망이 실시간으로 현재 상대 상태에 맞는 의도 궤적을 출력함으로써 온보드 유도 시스템에 적용 가능함을 시뮬레이션으로 검증한다.
상세 분석
이 연구는 자유비행 환경에서 두 항공기 간의 상대 유도 문제를 최소 시간 최적화라는 관점에서 접근한다. 먼저, 선행기(L)와 추종기(P)의 상대 위치를 극좌표(d, θ)와 각도(ψ L, ψ P)로 기술하고, 속도는 일정하다고 가정한다. 목표는 P가 L의 진행 방향과 동일한 궤적에 도달하면서 최소 거리 D ≥ d_min을 유지하도록 하는 것이다. 이를 위해 Hamiltonian을 구성하고, 라그랑주 승수 μ를 도입해 최소 거리 제약을 포함한 최적제어조건을 도출한다.
핵심 결과는 최적 궤적이 ‘정규 궤적’ 형태, 즉 최대 은행각(φ_max) 회전과 직선 구간을 교대로 연결한 구조임을 보인 점이다. 각 회전은 좌·우 방향(ε = ±1)과 회전 각도 θ_i, 직선 길이 l_i 로 파라미터화된다. 이러한 파라미터 집합을 최소화 목표인 ∑l_i + R∑θ_i(ε_i)와 제약식(초기·최종 상태, 최소 거리, 은행각 한계)에 대입해 혼합 정수 비선형 최적화 문제로 정의한다.
하지만 실시간 온보드 계산은 복잡도와 비선형성 때문에 불가능하므로, 저자들은 역동적 프로그래밍(Reverse DP) 방식을 채택한다. DP를 역방향으로 적용해 최종 수렴 상태에서 시작해 가능한 회전·직선 조합을 단계별로 탐색하고, 각 노드에 도달하는 최소 시간 값을 기록한다. 이렇게 생성된 트리 구조는 다양한 초기 상대 상태에 대한 최적 파라미터(ε, θ, l)를 제공한다.
생성된 데이터셋을 이용해 다층 피드포워드 신경망을 학습한다. 입력은 현재 상대 위치·각도(Δx, Δy, Δψ)이며, 출력은 최적 궤적을 정의하는 파라미터 집합이다. 신경망은 학습 후 실시간으로 현재 상태에 맞는 ‘의도 궤적’을 추정하고, 이를 매 초마다 자동조종 장치에 전달한다. 시뮬레이션에서는 두 대의 A300이 사용되었으며, 선행기가 급격히 방향을 바꾼 경우와 사전에 의도를 공유한 경우를 비교하였다. 의도 정보를 사전에 알 경우, 추종기는 불필요한 진동을 최소화하고 수렴 시간을 크게 단축할 수 있었다.
이 논문의 주요 기여는 (1) 최소 시간 수렴 궤적이 정규 형태임을 이론적으로 증명하고, (2) 역동적 프로그래밍을 활용해 대규모 최적 데이터베이스를 효율적으로 생성한 점, (3) 신경망을 통해 온보드 실시간 유도에 적용함으로써 자유비행 상황에서의 충돌 회피·합류를 경제적·안전적으로 수행할 수 있게 한 점이다. 또한, 최소 거리 제약을 라그랑주 승수로 처리한 방법은 항공기 운용 제한을 만족시키면서도 최적성을 유지한다는 장점을 제공한다. 향후 연구에서는 풍동·기상 변동을 포함한 비정상 상황, 다항목 항공기 간의 다중 합류 문제, 그리고 신경망의 온라인 재학습 메커니즘을 탐구할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기