USmorph의 견고성 분석: 비지도와 지도 학습을 통한 은하 형태 분류 효율성
초록
본 연구는 COSMOS 필드의 약 10만 개 I‑밴드 은하 이미지를 대상으로 하이브리드 머신러닝 프레임워크 USmorph의 핵심 모듈을 정량적으로 평가한다. 컨볼루션 오토인코더(CAE)는 5×5 커널, 중간 깊이, 40 차원 잠재공간에서 구조 보존 성능이 최적이며, 적응형 극좌표 변환(APCT)이 회전 불변성을 강화한다. 비지도 단계에서는 K=50인 bagging 클러스터링이 라벨링 효율과 분류 세분성 사이의 균형을 제공한다. 지도 단계에서는 GoogLeNet이 과적합 없이 안정적인 정확도를 유지한다. t‑SNE 시각화와 물리적 파라미터(세르시크 지수, 반경, Gini, M20)와의 일관성을 통해 최종 분류의 신뢰성을 검증하였다. 결과는 USmorph이 차세대 CSST 임무에 적용하기에 충분히 견고함을 보여준다.
상세 분석
USmorph은 이미지 압축·노이즈 제거를 위한 컨볼루션 오토인코더(CAE), 회전 불변성을 부여하는 적응형 극좌표 변환(APCT), 그리고 다중 클러스터링을 통한 라벨 생성·지도 학습을 결합한 파이프라인이다. 본 논문은 각 모듈의 하이퍼파라미터가 최종 분류 성능에 미치는 영향을 체계적으로 탐색한다. CAE는 두 단계의 5×5 컨볼루션 레이어와 최대 풀링을 거쳐 100×100 입력을 40 차원의 잠재벡터로 압축한다. 커널 크기를 3×3, 5×5, 7×7로 비교했을 때 5×5가 세부 구조를 보존하면서 과도한 스무딩을 방지한다는 것이 실험적으로 확인되었다. 또한 네트워크 깊이를 얕게(1 레이어) 혹은 깊게(3 레이어) 설정했을 때, 중간 깊이가 재구성 손실과 분류 정확도 사이에서 최적의 균형을 제공한다. APCT는 이미지 중심을 극좌표계로 변환하고 각도 정규화를 수행함으로써 회전된 은하 이미지가 동일한 특징 벡터로 매핑되도록 한다. 이는 특히 비지도 클러스터링 단계에서 군집 경계가 명확해지는 효과를 가져온다. Bagging 기반 다중 클러스터링에서는 클러스터 수 K를 20~100 범위에서 탐색했으며, K=50이 라벨당 평균 샘플 수와 군집 내 분산을 동시에 최소화한다는 결과가 도출되었다. 지도 학습 단계에서는 GoogLeNet을 사용했으며, 학습률, 배치 크기, 에포크 수를 변동시켜도 과적합 현상이 나타나지 않아 모델의 일반화 능력이 뛰어나다는 점을 확인했다. 최종 검증은 (1) t‑SNE를 이용한 저차원 시각화에서 서로 다른 형태군이 명확히 구분되는 클러스터를 형성하고, (2) 세르시크 지수 n, 반경 rₑ, Gini, M20 등 물리적 파라미터와의 분포가 기존 이론적 기대와 일치함을 보였다. 특히 true positive와 false positive가 파라미터 공간에서 편향 없이 고르게 분포함으로써 라벨링 오류가 물리적 해석에 미치는 영향을 최소화한다는 점이 강조된다. 이러한 종합적인 견고성 분석은 USmorph이 향후 CSST와 같은 대규모, 고해상도 광학 설문에서 자동 은하 형태 분류에 신뢰할 수 있는 도구임을 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기