위성 AI를 위한 하이브리드 모듈러 중복 DNN 가속기 Safe NEureka
초록
Safe-NEureka는 위성용 DNN 추론 가속기로, Dual Modular Redundancy(DMR) 기반의 신뢰 모드와 중복 회로를 병렬로 활용하는 고성능 모드를 동적으로 전환한다. 메모리 인터페이스는 ECC, 제어부는 TMR로 보호되며, 12 nm GF 공정에서 구현 시 신뢰 모드에서 96 % 오류 감소와 15 % 면적 증가, 고성능 모드에서는 기준 대비 5 % 스루풋 저하와 11 % 에너지 효율 감소만을 보인다.
상세 분석
본 논문은 위성 시스템이 동시에 요구하는 극한 신뢰성 및 고처리량이라는 상충 목표를 해결하기 위해 하이브리드 모듈러 중복(HMR) 개념을 DNN 가속기에 적용하였다. 기본 가속기인 NEureka의 4×4 MAC 배열을 두 개의 4×2 서브유닛으로 분할하고, 운영 모드에 따라 각각 DMR 실행(시간적 다양성 포함) 혹은 병렬 실행으로 전환한다. DMR 모드에서는 두 서브유닛이 동일 연산을 수행하고, 오류 검출 시 하드웨어 기반 복구 로직이 빠르게 재실행을 트리거한다. 복구는 제한된 레이턴시 내에 완료되도록 설계돼, 실시간 GNC와 같은 안전‑중요 작업에 적합하다. 고성능 모드에서는 두 서브유닛이 독립적으로 파이프라인을 공유해 연산량을 2배로 늘리며, 이는 3×3 밀집 컨볼루션 레이어에서 기준 대비 5 %만큼 스루풋이 감소하는 수준이다. 메모리와 인터커넥트는 전부 ECC로 보호되고, 제어 FSM은 면적 대비 비용이 낮은 TMR로 구현돼, 단일 비트 오류가 시스템 전체에 전파되는 것을 방지한다. 구현 결과는 GF 12 nm에서 전체 면적이 비중복 베이스라인 대비 15 % 증가했음에도 불구하고, 오류 주입 실험에서 신뢰 모드가 96 %의 오류 감소를 달성했으며, 에너지 효율은 고성능 모드에서 11 % 저하, 신뢰 모드에서는 53 % 저하라는 트레이드오프를 명확히 제시한다. 또한 설계가 오픈소스로 공개돼, 향후 위성용 AI 가속기의 표준화와 커스텀화에 기여할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기