색상 히스토그램과 CNN 융합을 통한 피부 병변 색상 수 자동 분류

색상 히스토그램과 CNN 융합을 통한 피부 병변 색상 수 자동 분류
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 피부 병변 이미지에서 나타나는 색상의 개수를 진단 지표로 활용한다. PH2 데이터셋의 색상 주석을 기반으로 색상 히스토그램 분석 알고리즘을 설계해 ISIC2016·Med‑Node 데이터셋에 대한 가짜 라벨을 생성하였다. 이후 19층 Residual‑Skip 구조를 갖는 CNN을 학습시켜 색상 수(1~3종)별로 병변을 분류했으며, 최고 성능은 가중 F1 = 75 %였다. 모델 해석을 위해 DeepDream과 LIME을 적용해 색상 관련 특징이 네트워크의 핵심 판단 근거임을 확인하였다.

상세 분석

이 논문은 색상 히스토그램 기반 전통 이미지 처리와 최신 딥러닝을 결합한 하이브리드 파이프라인을 제시한다. 첫 단계에서 저자들은 PH2 데이터셋에 존재하는 6가지 색상(흰색, 빨간색, 연갈색, 진갈색, 파랑‑회색, 검정색)의 픽셀 분포를 정량화하고, 각 색상의 HSV/RGB 임계값을 도출하였다. 이러한 임계값을 이용해 색상 라벨이 없는 ISIC2016 및 Med‑Node 이미지에 대해 자동 색상 추출을 수행했으며, 추출된 색상 수(1~3)를 ‘색상 수 라벨’로 사용하였다. 라벨링 과정에서 색상 중복 및 경계 혼합을 최소화하기 위해 색상별 마스크를 후처리(모폴로지 연산, 작은 영역 제거)했으며, 다중 색상이 겹치는 경우 가장 높은 빈도 색상만을 선택하는 규칙을 적용하였다.

CNN 설계는 19층으로 구성되며, 기본 블록은 3×3 Conv‑BN‑ReLU이며, 3개의 Residual Skip Connection을 삽입해 기울기 소실을 방지하고 얕은 특징과 깊은 특징을 효과적으로 결합한다. 입력은 224×224×3 RGB 이미지이며, 최종 전역 평균 풀링 후 Softmax를 통해 3가지 클래스(색상 1종, 2종, 3종)로 분류한다. 하이퍼파라미터 탐색에서는 학습률 1e‑4, 배치 크기 32, Adam 옵티마이저, Dropout 0.3을 최적으로 선정하였다. 교차 검증 결과, Residual Skip이 없는 기본 CNN 대비 F1 점수가 평균 6 %p 상승했으며, 특히 색상 3종을 구분하는 정확도가 크게 개선되었다.

모델 해석 단계에서는 DeepDream을 활용해 각 레이어가 강조하는 색상 패턴을 시각화하였다. 초기 레이어는 엣지와 색상 경계에 민감했으며, 중간 레이어는 특정 색상 영역(예: 검정‑갈색 대비)과 그 텍스처를 강조했다. 최종 레이어는 다중 색상 조합을 포착해 클래스 결정에 기여하는 영역을 강조하였다. LIME 분석 결과, 모델이 주로 색상 변이와 그 경계가 뚜렷한 부위를 중요한 피처로 사용했으며, 이는 임상적으로 “색상 다양성”이 악성 멜라노마의 위험 요인이라는 의학적 근거와 일치한다.

성능 평가는 가중 F1 = 75 %를 기록했으며, 클래스별 정밀도·재현율은 0.71~0.78 사이였다. PH2에서 직접 라벨링된 데이터와 자동 라벨링된 ISIC/Med‑Node 데이터 모두에서 일관된 성능을 보였으며, 데이터셋 간 도메인 차이(해상도, 촬영 조건)에도 비교적 강인한 일반화 능력을 확인했다. 한계점으로는 색상 라벨링이 HSV 임계값에 의존해 조명 변화에 민감하고, 색상 수가 3종을 초과하는 경우 라벨링 정확도가 떨어진다는 점을 지적한다. 향후 연구에서는 색상 공간을 CIELAB 등 인간 시각에 더 근접한 모델로 확장하고, 멀티라벨(색상 종류와 위치) 학습을 통해 보다 정교한 진단 지원 시스템을 구축할 수 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기