뇌처리장치에서 비전 트랜스포머 가속을 위한 컨볼루션 변환 기법
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 CNN 전용 가속 하드웨어인 BPU의 INT8 컨볼루션 최적화를 활용하기 위해 Vision Transformer(DeiT)의 선형 레이어와 LayerNorm을 1×1 컨볼루션으로 대체한다. 기존 가중치를 그대로 재사용하고, 사후 양자화(PTQ)만으로도 이미지넷에서 80.4% 정확도와 최대 3.8배의 추론 속도 향상을 달성한다.
상세 분석
이 연구는 BPU가 4차원 텐서(
댓글 및 학술 토론
Loading comments...
의견 남기기