Turbo NOC 고성능 터보 디코더 설계 프레임워크
초록
본 논문은 네트워크‑온‑칩(NoC) 기반 터보 디코더의 설계와 시뮬레이션을 위한 통합 프레임워크를 제시한다. 설계 공간을 네트워크 토폴로지, 병렬도, 메시지 전송률, 라우팅 전략 네 가지 축으로 나누어 탐색하고, 각각이 전체 처리량과 실리콘 면적에 미치는 영향을 정량적으로 평가한다. 실험 결과, 높은 처리량을 유지하면서 복잡도 증가를 최소화할 수 있는 최적 토폴로지는 일반화된 de‑Bruijn과 일반화된 Kautz이며, 요구되는 처리량에 따라 적절한 병렬도·전송률·라우팅 알고리즘을 선택함으로써 면적 오버헤드를 최소화할 수 있음을 확인한다.
상세 분석
본 연구는 터보 디코더의 핵심 연산인 MAP(Maximum‑A‑Posteriori) 알고리즘을 다수의 프로세싱 노드에 분산시키고, 이들 노드 간에 교환되는 소프트 정보(LLR)를 효율적으로 전달하기 위해 NoC 구조를 채택한다. 설계 파라미터로는 (1) 토폴로지 종류, (2) 병렬 처리 유닛 수(P), (3) 메시지 주입률(R) 즉, 한 사이클당 전송 가능한 패킷 수, (4) 라우팅 전략(정적 라우팅, 최소 홉 라우팅, 적응형 라우팅) 등을 정의하고, 각각을 조합한 설계 후보군을 시뮬레이션 기반으로 평가한다. 토폴로지 측면에서는 전통적인 메쉬, 토리, 하이퍼큐브와 더불어, 정규 그래프 이론에서 유도된 일반화된 de‑Bruijn과 Kautz 그래프를 구현한다. 이들 그래프는 노드 수가 증가해도 평균 경로 길이가 로그 규모로 유지되어, 패킷 전송 지연과 네트워크 혼잡을 크게 감소시킨다. 병렬도 P를 늘리면 각 사이클당 처리 가능한 심볼 수가 증가하지만, 동시에 네트워크에 가해지는 트래픽도 비례적으로 상승한다. 따라서 R을 조절해 네트워크 포화점을 피하면서도 목표 처리량을 달성해야 한다. 라우팅 전략에서는 정적 라우팅이 구현 복잡도가 낮아 면적 절감에 유리하지만, 트래픽 불균형 시 병목 현상이 발생한다. 반면 적응형 라우팅은 실시간 혼잡 정보를 활용해 경로를 동적으로 재조정함으로써 전송 지연을 최소화하지만, 라우터 내부에 추가적인 버퍼와 제어 로직이 필요해 면적·전력 비용이 상승한다. 시뮬레이션 결과, 높은 처리량(>1 Gbps) 요구 시 P = 64, R = 2, 그리고 최소 홉 라우팅을 적용한 일반화된 Kautz 토폴로지가 가장 효율적이었다. 반면 저전력·저면적 목표에서는 P = 32, R = 1, 정적 라우팅을 이용한 일반화된 de‑Bruijn이 최적이었다. 이러한 결과는 NoC 기반 터보 디코더 설계 시 토폴로지와 라우팅 선택이 면적·전력·성능 트레이드오프에 결정적인 역할을 함을 명확히 보여준다.
댓글 및 학술 토론
Loading comments...
의견 남기기