온칩 비선형성을 활용한 심층 광학 저장소 컴퓨팅
초록
본 논문은 실리콘 마이크로링 공진기(MRR)의 자유 전자 캐리어 동역학을 이용한 비선형성을 핵심으로, 시간 지연 기반 심층 광학 저장소 컴퓨팅(DPRC) 구조를 제안한다. 다중 파장 채널과 진정한 시간 지연 라인을 결합해 고차원 표현과 다중 시간 스케일 기억을 구현하고, NTU‑RGB+D 액션 인식 벤치마크에서 8계층 DPRC가 98.1%·96.7%의 정확도를 달성함을 실험적으로 입증한다. 또한 334 TOPS/mm²의 연산 밀도를 기록하며, 하드웨어 오버헤드 없이 깊이와 채널을 확장할 수 있음을 보여준다.
상세 분석
이 연구는 광학 신경망 분야에서 가장 큰 난제 중 하나인 ‘스케일 가능한 온칩 비선형성’ 문제를 자유 전자 캐리어 효과(free‑carrier dynamics)를 활용해 해결한다는 점에서 혁신적이다. 실리콘 마이크로링 공진기(MRR)는 두 광자 흡수(two‑photon absorption)와 자유 전자 분산(free‑carrier dispersion)이라는 두 가지 비선형 메커니즘을 동시에 제공한다. 입력 파워가 공진점에 근접하면 전자 밀도가 급격히 증가하고, 이로 인한 굴절률 변동이 출력 신호를 비선형적으로 변조한다. 전자 재결합 시간은 수 나노초 수준으로, 입력 펄스 사이에 남는 잔류 전자 농도는 다음 입력에 대한 기억을 형성한다. 따라서 MRR 자체가 ‘짧은‑시간 메모리(short‑term memory)’와 ‘비선형 매핑’를 동시에 수행하는 물리적 뉴런 역할을 한다.
시간 지연 라인은 이러한 MRR 기반 뉴런들을 가상 노드(virtual neuron)로 확장한다. 하나의 MRR에 수백 개의 가상 노드를 시간 다중화(time‑multiplex)함으로써, 각 가상 노드는 서로 다른 시점에 입력을 받아 비선형 변환을 거친 뒤, 지연 라인을 통해 순환 연결된다. 지연 라인의 물리적 길이에 따라 수 나노초에서 수십 나노초까지의 ‘긴‑시간 메모리(long‑term memory)’가 제공되며, 이는 MRR의 전자 재결합 시간과 결합해 다중 시간 스케일 fading memory를 구현한다. 이러한 멀티스케일 기억 구조는 전통적인 디지털 딥러닝 모델이 필요로 하는 복잡한 역전파 학습 없이도 고차원 특징을 효율적으로 추출한다.
구조적 측면에서 저자는 ‘층(layer)’ 개념을 물리적 레이어와 가상 레이어로 구분한다. 물리적 레이어는 서로 다른 파장 채널에 할당된 MRR 배열이며, 각 파장은 독립적인 데이터 스트림을 동시에 처리한다. 가상 레이어는 시간 지연 라인을 통해 순차적으로 연결된 MRR 내부의 가상 노드 집합이다. 이렇게 하면 ‘깊이(depth)’와 ‘폭(width)’을 동시에 확장할 수 있다. 파장 다중화는 동일한 지연 라인을 공유하므로, 추가적인 하드웨어 면적이나 전력 소비 없이도 수십 개의 병렬 채널을 구현할 수 있다.
성능 평가에서는 NTU‑RGB+D 데이터셋을 사용해 8‑layer DPRC가 150개의 가상 뉴런을 각 레이어에 배치했을 때, 교차‑뷰(Cross‑View) 98.1%, 교차‑주제(Cross‑Subject) 96.7%의 정확도를 기록했다. 이는 파라미터 수가 약 1.1 M에 불과함에도 불구하고, 최신 그래프 컨볼루션 네트워크(GCN)와 트랜스포머 모델을 능가한다. 학습 과정은 단일 회귀(readout) 단계만 필요하므로, 수분 내에 상태를 획득하고 가중치를 계산할 수 있다.
하드웨어 실험에서는 1.78 mm² 면적에 6개의 MRR, 2개의 지연 라인, 3개의 MZI 스위치를 집적한 프로토타입을 제작했다. 자유 전자 캐리어에 의한 비선형 응답은 6 dBm 펌프 파워에서 명확히 관측되었으며, 0.2 ns 펄스 입력에 대해 1.45 ns의 지연 피크가 나타나 메모리 효과를 확인했다. 연산 밀도는 334 TOPS/mm²로, 기존 광학 저장소 구현 대비 3 order magnitude 향상되었다.
전반적으로 이 논문은 (1) 실리콘 포톤 기반 비선형 뉴런 구현, (2) 시간 지연을 이용한 다중 시간 스케일 메모리, (3) 파장 다중화를 통한 하드웨어 효율성, (4) 단일‑샷 회귀 학습으로 인한 학습 비용 절감이라는 네 가지 핵심 혁신을 결합한다. 이러한 설계는 초고속 실시간 비전, 로보틱스 제어, 고속 통신 등 다양한 응용 분야에서 전통적인 전자식 AI 가속기보다 뛰어난 성능·전력 비율을 제공할 가능성을 열어준다.
댓글 및 학술 토론
Loading comments...
의견 남기기