AI 기반 폐기물 분류로 순환경제와 도시 지속가능성 지원

AI 기반 폐기물 분류로 순환경제와 도시 지속가능성 지원
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 25,077장의 폐기물 이미지(유기·재활용 2분류)를 활용해 전통 머신러닝(Random Forest, SVM, AdaBoost)과 다양한 딥러닝 모델(CNN, VGG16, ResNet50, DenseNet121, EfficientNetB0, InceptionV3)을 비교한다. 데이터는 150×150 px로 리사이즈·증강 후 80/20 비율로 학습·시험을 나누었으며, 전통 모델에 PCA 차원축소를 적용했다. DenseNet121이 정확도 91 %와 ROC‑AUC 0.98로 최고 성능을 보였으며, 전통 모델 대비 20 %p 향상했다. PCA는 전통 모델에 큰 영향을 주지 않았고, 전이학습이 제한된 데이터 환경에서 효과적이었다. 마지막으로 실시간 의사결정지원시스템(DSS)에 모델을 통합하는 방안을 제시해 스마트시티 폐기물 자동분류와 매립지 감소, 환경영향 저감 가능성을 논의한다.

상세 분석

이 연구는 순환경제 구현을 위한 핵심 과제인 폐기물 자동분류 문제를 데이터‑드리븐 접근으로 해결하고자 한다. 데이터셋은 Kaggle에서 수집한 25,077장의 고해상도 이미지이며, 유기 폐기물과 재활용 폐기물 두 클래스로 라벨링되어 있다. 이미지 전처리 단계에서 RGB 변환, 0‑1 정규화, Canny 엣지 검출, 그리고 회전·이동·수평 뒤집기 등 다양한 증강 기법을 적용해 모델의 일반화 능력을 강화하였다. 전통 머신러닝 파이프라인에서는 원시 픽셀을 1‑차원 벡터로 펼친 뒤, PCA를 통해 차원을 200~300 차원으로 축소하였다. 그러나 실험 결과, PCA 적용 여부가 정확도·정밀도·재현율에 미치는 차이는 미미했으며, 이는 이미지 데이터가 이미 공간적 구조를 갖고 있어 선형 차원축소가 큰 이점을 제공하지 못함을 시사한다.

딥러닝 측면에서는 자체 설계 CNN과 VGG16, ResNet50 같은 일반적인 아키텍처 외에 DenseNet121, EfficientNetB0, InceptionV3 등 최신 전이학습 모델을 활용하였다. 모든 전이학습 모델은 ImageNet 사전학습 가중치를 그대로 사용하고, 마지막 Fully‑Connected 레이어만 두 클래스에 맞게 재구성하였다. 특히 DenseNet121은 Dense Block 구조를 통해 특성 재사용과 그래디언트 흐름을 최적화함으로써 91 %의 정확도와 0.98의 ROC‑AUC를 달성했다. 이는 전통 모델(RF, SVM, AdaBoost)의 최고 성능(≈71 %)보다 약 20 %p 높은 수치이며, 데이터 양이 제한된 상황에서도 전이학습이 강력한 일반화 능력을 제공한다는 점을 확인시킨다.

모델 평가에서는 정확도 외에도 정밀도, 재현율, F1‑score, ROC‑AUC를 종합적으로 분석했으며, 혼동 행렬을 통해 오분류 패턴을 시각화하였다. 전통 모델은 전반적으로 70‑72 % 수준의 정확도를 보였고, 하이퍼파라미터 튜닝이나 PCA 적용에도 큰 변동이 없었다. 반면 전이학습 모델은 학습 곡선이 빠르게 수렴하고, 과적합 방지를 위한 Early Stopping이 효과적으로 작동했다.

시스템 통합 측면에서는 모델을 실시간 의사결정지원시스템(DSS)에 배치하는 아키텍처를 제시한다. 이미지 캡처 → 전처리 → 모델 추론 → DSS 피드백 → 자동 분류 로봇 혹은 스마트 쓰레기통으로 흐르는 파이프라인이며, Edge 디바이스에서 추론을 수행해 지연 시간을 최소화한다. 이를 통해 매립지 사용량 감소, 재활용률 상승, 전반적인 탄소 발자국 저감 효과를 기대한다.

한계점으로는 데이터셋이 이진 분류에 국한돼 있어 실제 현장의 다중 폐기물 종류(플라스틱, 금속, 유리 등)로 확장하기 위한 추가 연구가 필요하고, 모델 경량화와 에너지 효율성 측면에서 Edge 환경에 최적화된 경량 전이학습 모델(예: MobileNetV3) 검증이 부족하다. 또한, 실제 스마트시티 인프라와 연계한 파일럿 테스트가 없으며, 정책·경제적 인센티브와의 연계 방안도 구체적으로 제시되지 않았다. 향후 연구에서는 다중 클래스 데이터셋 구축, 모델 압축·양자화, 그리고 실증 파일럿을 통한 비용‑편익 분석이 요구된다.


댓글 및 학술 토론

Loading comments...

의견 남기기