다양한 형태의 결함을 잡아내는 FiLo++: 세밀한 텍스트와 변형형 로컬라이제이션의 결합

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

**
FiLo++는 대규모 언어 모델로부터 얻은 세밀한 결함 설명과 고정·학습 가능한 프롬프트를 융합한 FusDes와, Grounding DINO와 다중‑스케일 변형 컨볼루션을 활용한 DefLoc을 통해 제로·소수 샷 이상 탐지와 정확한 결함 위치 추정을 동시에 달성한다.

상세 분석

**
본 논문은 기존 제로‑샷 이상 탐지(ZSAD)와 소수‑샷 이상 탐지(FSAD)에서 흔히 발생하는 두 가지 한계를 체계적으로 해결한다. 첫 번째는 “정상/비정상”이라는 일반적인 텍스트 프롬프트가 객체마다 다양하게 나타날 수 있는 결함 유형을 포괄하지 못한다는 점이다. 이를 극복하기 위해 FiLo++는 Large Language Model(LLM, 예: GPT‑4)에게 각 카테고리별 구체적인 결함 유형을 생성하도록 요청하고, 이 결과를 고정 템플릿(예: “A photo of

다양한 형태의 결함을 잡아내는 FiLo++: 세밀한 텍스트와 변형형 로컬라이제이션의 결합

초록

상세 분석

댓글 및 학술 토론

의견 남기기