SVM 기반 토지피복 분류 1대1과 1대다 비교

초록

본 연구는 원격탐사에서 토지피복을 분류할 때 사용되는 서포트 벡터 머신(SVM)의 다중 클래스 구현 방법인 One‑Against‑One(1A1)과 One‑Against‑All(1AA)를 비교한다. 실험 결과 1AA는 미분류·혼합 픽셀이 다소 발생하지만 전체 정확도는 1A1과 유의미한 차이가 없으며, 최종 선택은 데이터 특성과 연구자의 선호에 달려 있음을 제시한다.

상세 요약

SVM은 본래 이진 분류기에 기반을 두고 있어 다중 클래스 문제를 해결하기 위해 두 가지 전형적인 전략이 널리 사용된다. One‑Against‑One(1A1) 방식은 클래스 쌍(pair)마다 별도의 이진 SVM을 학습시켜 총 K(K‑1)/2개의 분류기를 만든다. 각 분류기는 해당 두 클래스에만 초점을 맞추므로 경계가 비교적 명확하고, 다수결 투표 방식으로 최종 클래스를 결정한다. 반면 One‑Against‑All(1AA) 방식은 각 클래스마다 하나의 이진 SVM을 학습시키되, 해당 클래스를 양성, 나머지 모든 클래스를 음성으로 설정한다. 따라서 K개의 분류기가 필요하고, 테스트 단계에서는 각 분류기의 결정값을 비교해 가장 높은 점수를 받은 클래스를 선택한다.

논문에서는 두 방법을 동일한 원격탐사 데이터셋(다중 스펙트럼 이미지)과 동일한 전처리 절차(대기 보정, 정규화) 하에 적용하였다. 학습 샘플 수는 제한된 상황을 가정해 각 클래스당 30~50개의 픽셀만 사용했으며, 커널 함수는 RBF를 채택하고 하이퍼파라미터(C, γ)는 교차 검증을 통해 최적화하였다. 평가 지표는 전체 정확도, Kappa 계수, 그리고 미분류·혼합 픽셀 비율이었다.

실험 결과 1A1은 대부분의 경우 높은 정확도와 낮은 미분류 비율을 보였지만, 클래스 수가 증가할수록 학습해야 할 분류기 수가 급격히 늘어나 계산 비용이 크게 증가한다는 단점이 드러났다. 반면 1AA는 클래스가 많아질수록 학습 비용이 선형적으로 증가해 상대적으로 효율적이지만, 음성 클래스를 모두 포함하는 특성상 경계가 모호해져 특정 클래스에 대한 오분류가 발생하고, 특히 훈련 샘플이 부족한 경우 미분류 혹은 혼합 픽셀이 다소 늘어나는 경향을 보였다. 그러나 전체 정확도와 Kappa 값에서는 두 방법 간에 통계적으로 유의미한 차이가 없었으며, 이는 실제 토지피복 매핑에서 선택이 크게 성능에 영향을 미치지 않음을 의미한다.

또한 논문은 데이터 특성—예를 들어 스펙트럼 차이가 뚜렷한 클래스 간 구분이 쉬운 경우와, 유사한 스펙트럼을 가진 클래스가 혼재하는 경우—에 따라 1A1과 1AA의 상대적 장단점이 달라질 수 있음을 강조한다. 특히 고해상도 이미지에서 미세한 토지피복 유형을 구분하려면 클래스 간 경계가 복잡해지므로 1A1이 더 안정적인 결과를 제공할 가능성이 있다. 반면 대규모 저해상도 데이터셋에서는 계산 효율성을 위해 1AA가 실용적일 수 있다.

결론적으로, 저자들은 두 접근법 모두 실용적인 선택지이며, 최종 선택은 연구 목적, 데이터 규모, 컴퓨팅 자원, 그리고 사용자가 허용할 수 있는 미분류·혼합 픽셀 비율에 따라 달라진다고 주장한다.

초록

상세 요약

📜 논문 원문 (영문)