LLM 기반 신경망 설계: 엄격한 API 계약 하에 이미지 캡셔닝 모델 자동 생성

읽는 시간: 1 분
...

📝 원문 정보

  • Title: LLM as a Neural Architect: Controlled Generation of Image Captioning Models Under Strict API Contracts
  • ArXiv ID: 2512.14706
  • 발행일: 2025-12-07
  • 저자: Krunal Jesani, Dmitry Ignatov, Radu Timofte

📝 초록 (Abstract)

신경망 구조 탐색(NAS)은 기존에 인간 전문가의 풍부한 지식이나 무수한 자동 시도‑오류에 의존해 왔다. 본 연구는 LLM‑Guided NAS 파이프라인인 NN‑Caption을 제안한다. 이 파이프라인은 LEMUR의 이미지 분류 백본을 CNN 인코더로, LSTM·GRU·Transformer 등 시퀀스 디코더를 조합하여, 정해진 Net API

💡 논문 핵심 해설 (Deep Analysis)

Figure 1
본 논문은 최근 급부상하고 있는 대형 언어 모델(LLM)을 NAS의 핵심 엔진으로 활용한다는 점에서 혁신적이다. 전통적인 NAS는 진화적 알고리즘, 강화학습, 혹은 그리드/랜덤 탐색 등 복잡한 최적화 절차를 필요로 하며, 설계된 아키텍처가 실제 코드와 완전히 일치하도록 보장하기 어렵다. NN‑Caption은 이러한 한계를 “프롬프트 → 코드 → 자동 평가”라는 삼각형 워크플로우로 해결한다.

첫 번째 핵심은 엄격한 Net API 계약이다. 논문은 API 정의를

📄 논문 본문 발췌 (Translation)

...(본문 내용이 길어 생략되었습니다. 사이트에서 전문을 확인해 주세요.)

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키