구아바 질병 자동분류 InceptionV3와 ResNet50 비교 연구

구아바 질병 자동분류 InceptionV3와 ResNet50 비교 연구
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 Mendeley Data에서 수집한 473장의 구아바 이미지에 CutMix·MixUp 데이터 믹싱과 256×256 리사이징을 적용한 후, 3784장의 증강 데이터를 이용해 InceptionV3와 ResNet50 두 딥러닝 모델을 학습시켰다. InceptionV3는 98.15%의 정확도, ResNet50은 94.46%의 정확도를 달성했으며, 혼동 행렬과 SHAP 기반 설명 가능성 분석을 통해 모델의 강점과 약점을 정량·정성적으로 평가하였다.

상세 분석

본 논문은 구아바 과일의 세 가지 상태(Anthracnose, Fruit fly, Healthy)를 분류하기 위해 전이 학습 기반의 두 대표적 CNN 구조인 InceptionV3와 ResNet50을 비교한다. 데이터 전처리 단계에서는 원본 이미지(473장)를 256×256 RGB 형식으로 통일하고, CutMix와 MixUp을 결합한 데이터 믹싱 기법을 적용해 클래스 간 경계 정보를 강화하였다. 이러한 방식은 특히 작은 데이터셋에서 과적합을 완화하고 일반화 성능을 높이는 데 기여한다는 점이 기존 연구와 일치한다.

증강 후 데이터는 3784장으로 확대되었으며, 학습‑검증‑테스트 비율은 70:20:10 정도로 분할하였다. InceptionV3는 1×1, 3×3, 5×5 컨볼루션을 병렬로 수행하는 인셉션 블록을 통해 다중 스케일 특징을 효과적으로 추출한다. 또한 Global Average Pooling을 사용해 파라미터 수를 감소시켜 과적합 위험을 낮추었다. 학습 설정은 배치 크기 32, 에폭 100, 학습률 1e‑4, Adam 옵티마이저, EarlyStopping(patience=10) 및 ModelCheckpoint를 포함한다. 결과적으로 훈련 정확도는 거의 100%에 수렴했으며, 검증 정확도는 99.96%에 달했다. 다만 훈련 손실이 급격히 감소하는 반면 검증 손실은 초기 몇 에폭 이후 완만히 유지돼 과적합 가능성을 시사한다.

ResNet50은 50개의 레이어와 잔차 연결을 활용해 깊은 네트워크에서도 기울기 소실을 방지한다. 동일한 데이터 증강과 학습 파라미터(배치 32, 에폭 34, 학습률 1e‑4, Adam)로 실험했으며, 훈련 정확도는 90% 이상을 유지했지만 검증 정확도는 80% 수준에 머물렀고, 에폭이 진행될수록 변동성이 커졌다. 이는 작은 데이터셋에서 ResNet50이 복잡한 모델 구조로 인해 일반화가 어려워졌음을 의미한다.

성능 평가에서는 혼동 행렬과 SHAP(Shapley Additive exPlanations) 분석을 병행하였다. InceptionV3는 Anthracnose와 Fruit fly 클래스에서 100% 정확도를 기록했으며, Healthy 클래스에서 7건을 Fruit fly로 오분류했다. 전체 379건 중 372건을 정확히 분류해 98.15%의 정확도를 달성했다. SHAP 시각화는 병변 부위(색 변색, 껍질 손상 등)가 모델 예측에 큰 기여를 함을 확인시켰다. 반면 ResNet50은 Anthracnose 166건 중 4건을 Healthy로, Fruit fly 106건 중 12건을 다른 클래스(Anthracnose·Healthy)로 오분류했으며, Healthy 클래스에서도 5건을 오분류했다. 전체 377건 중 363건을 정확히 분류해 94.46%의 정확도를 기록했다.

두 모델을 비교하면 InceptionV3가 데이터 증강과 멀티스케일 특징 추출에 강점을 보여 작은 농업 이미지 데이터셋에서 높은 정확도와 안정적인 일반화 성능을 보인다. 반면 ResNet50은 깊은 구조가 오히려 과적합을 유발하고, 검증 단계에서 성능 변동이 커지는 경향을 보였다. 따라서 실시간 현장 적용이나 모바일 디바이스에 배포할 경우 InceptionV3 기반 경량화 모델이 더 적합할 것으로 판단된다. 또한 CutMix·MixUp과 같은 데이터 믹싱 기법이 두 모델 모두에서 성능 향상에 기여했으며, SHAP 기반 설명 가능성 확보는 농업 현장 전문가가 모델 결과를 신뢰하고 의사결정에 활용할 수 있는 기반을 제공한다.


댓글 및 학술 토론

Loading comments...

의견 남기기