초소형 비전 트랜스포머로 구현한 감자 잎 병원균 실시간 분류
본 논문은 자원 제한 환경에서도 높은 정확도와 빠른 추론을 제공하는 경량 Vision Transformer인 Tiny‑ViT를 감자 잎의 초기·말기 블라이트와 정상 잎을 구분하는 3‑클래스 문제에 적용하였다. 이미지 전처리로 CLAHE와 Gaussian Blur를 사용하고, 데이터 증강으로 일반화를 강화하였다. 제안 모델은 테스트 정확도 99.85%, 교차 검증 평균 99.82%, MCC 0.9990 및 좁은 신뢰구간을 기록했으며, DEIT S…
저자: Shakil Mia, Umme Habiba, Urmi Akter
본 연구는 감자 잎의 주요 병인인 초기 블라이트(Early Blight)와 후기 블라이트(Late Blight)를 정확히 구분하고, 정상 잎과 구별하는 3‑클래스 분류 문제를 해결하기 위해 경량 Vision Transformer인 Tiny‑ViT를 맞춤 설계하였다. 데이터는 Kaggle에서 제공된 1,500장의 고해상도 이미지(각 클래스 500장)를 사용했으며, 75 %를 학습, 10 %를 검증, 15 %를 테스트로 분할하였다. 전처리 단계에서는 이미지 크기 통일, CLAHE(Contrast Limited Adaptive Histogram Equalization) 적용, Gaussian Blur를 통한 노이즈 감소, 그리고 0‑1 정규화를 수행해 모델이 중요한 색·텍스처 정보를 효과적으로 학습하도록 하였다.
데이터 증강으로는 수평·수직 뒤집기, 회전, 줌, 밝기 변동을 적용해 학습 데이터량을 3배로 확대했으며, 이는 과적합 방지와 일반화 성능 향상에 기여하였다. 모델 아키텍처는 Tiny‑ViT‑5M(약 5 M 파라미터)을 기반으로 하되, 두 개의 추가 레이어를 삽입하였다. 첫 번째는 Transformer Encoder 레이어를 하나 더 추가해 전역적인 컨텍스트 정보를 강화하고, 두 번째는 Feed‑Forward 네트워크를 심화시켜 비선형 결정 경계를 보다 정교하게 학습하도록 설계하였다. 이러한 구조적 보강은 파라미터 수를 크게 늘리지 않으면서도 특징 표현력을 크게 향상시켰다.
학습은 AdamW 옵티마이저와 Cosine Annealing 학습률 스케줄러를 사용했으며, 배치 크기 32, 초기 학습률 1e‑3으로 50 epoch까지 진행하였다. 평가 지표로는 정확도, 교차 검증(CV) 평균 정확도, Matthews Correlation Coefficient(MCC), 95 % 신뢰구간(CI), FLOPs, 메모리 사용량, 추론 시간 등을 사용하였다. 실험 결과, 제안 모델은 테스트 정확도 99.85 %, CV 평균 정확도 99.82 %를 기록했으며, MCC 0.9990, CI
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기