
анал로그 비휘발성 메모리 크로스바이에서의 DNN IoT 애플리케이션 훈련을 위한 준비
에너지 효율성, 보안 및 프라이버시에 대한 추세로 인해 최근 딥러닝 네트워크(DNNs)를 마이크로컨트롤러에 배포하는 것에 대한 관심이 높아지고 있다. 그러나 계산과 메모리 자원의 제한으로 이러한 시스템에서 배치 가능한 ML 모델의 크기와 복잡도가 제약받고 있다. 저항성 비휘발성 메모리(NVM) 기술을 기반으로 하는 컴퓨테이션-인-메모리(CIM) 아키텍처는 현대 DNN에서 요구되는 고성능과 저전력에 대한 계산 및 메모리 요구를 충족할 가능성을 보여주고 있다. 그러나 이러한 기술들은 아직 미숙하고, 본질적인 아날로그 도메인 노이즈 문제와 NVM 구조에서 음의 가중치 표현 불가능성으로 인해 크로스바 크기가 커지고, 이에 따라 ADC 및 DAC에도 영향을 준다. 본 논문에서는 이러한 과제를 해결하기 위한 훈련 프레임워크를 제공하고, 이를 통해 얻어진 회로 수준의 효율성 개선을 정량적으로 평가한다. 두 가지 기여를 제시한다 첫째, 각 DNN 계층별 조정이 필요하지 않은 훈련 알고리즘으로 계층 가중치 및 활성화에 대한 일관성을 보장한다. 이는 아날로그 블록을 재사용하고 주변 하드웨어를 크게 줄일 수 있다. 둘째, NAS 방법을 사용하여 단극 가중치(모두 양수 또는 모두 음수) 행렬/부행렬을 제안한다. 가중치의 단극성은 크로스바 면적을 두 배로 늘리는 필요성을 없애고 아날로그 주변 하드웨어를 간소화한다. CIFAR10과 HAR 애플리케이션에 대한 방법론 검증을 위해 4비트 및 2비트 장치를 사용하여 크로스바에 매핑하였다. 우리는 HAR의 경우 2비트 양수 가중치만을 사용해 최대 92 91% 정확도(95% 부동소수점)를 달성하였으며, 제안된 기법들의 조합으로 80% 면적 개선과 최대 45% 에너지 감소를 이루었다.
