전 세계 농경지 경계 추출을 위한 필드 가이드
초록
본 논문은 24개국에 걸친 160만 개 필드 폴리곤을 포함한 FTW 데이터셋과 사전 학습된 U‑Net 기반 세그멘테이션 모델, 그리고 명령줄 도구를 제공한다. 바이템포럴 Sentinel‑2 영상을 이용해 필드 경계를 자동 추출하고, MOSAIKS 임베딩을 활용한 소량 라벨 기반 작물 분류와 Hansen GFC를 이용한 산림 손실 연계 분석을 시연한다. 또한 5개 국가에 대한 사전 계산된 Zarr 아카이브를 공개해 대규모 공간·시간 분석을 가능하게 한다.
상세 분석
FTW 프로젝트는 전 세계 농업 모니터링에 필수적인 필드 경계 데이터를 표준화·확장성 있게 제공한다는 점에서 큰 의미를 가진다. 데이터 측면에서 24개국, 1.6 M 폴리곤이라는 규모는 기존 지역 한정 데이터셋에 비해 월등히 다양하고 포괄적이며, 작은 규모(≤1 ha)부터 대규모(≥100 ha)까지 다양한 필드 크기를 포함한다는 점이 모델의 일반화 능력을 검증하는 데 유리하다. 모델 아키텍처는 EfficientNet‑B3를 백본으로 하는 U‑Net 구조이며, 바이템포럴 입력(플랜팅·하베스트 시기의 RGB+NIR 4채널)을 사용해 작물의 페노롤로지 변화를 포착한다. 이는 단일 시점 이미지에 비해 경계 검출 정확도를 크게 향상시킬 것으로 기대된다.
전처리 단계에서 Microsoft Planetary Computer의 STAC API를 활용해 구름 없는 Level‑2A 반사율을 자동 수집하고, 지역별 작물 달력을 기반으로 3–6개월 간격의 시계열을 구성한다. 이후 10 m 해상도의 4채널 합성 영상을 median composite 방식으로 생성해 대기·조명 변동을 최소화한다. 모델 출력은 필드 내부, 경계, 배경에 대한 픽셀별 확률 맵이며, softmax 값 0.5 임계값과 형태학적 opening을 적용해 잡음을 제거한다. 폴리곤화는 연결 요소 분석과 벡터화 파이프라인을 통해 수행되며, 필요 시 ESA WorldCover와 같은 LULC 마스크로 비농업 영역을 필터링한다.
작물 분류는 MOSAIKS 임베딩을 이용한다. MOSAIKS는 무작위 3×3 필터 256개를 적용해 고정 차원의 임베딩을 생성하고, 이를 선형 로지스틱 회귀에 입력한다. USDA CDL 라벨을 사용한 실험에서 라벨 10 %만으로도 전체 라벨 대비 F1 점수 차이가 5 % 이내에 머물렀으며, 매크로 F1는 0.65–0.75 수준을 기록했다. 이는 라벨이 부족한 소규모 농가 지역에서도 효과적인 few‑shot 학습이 가능함을 시사한다.
산림 손실 연계는 Hansen Global Forest Change 데이터와의 공간 조인으로 구현된다. FTW 폴리곤별 연도별 손실 픽셀 비율을 집계해 최근(2015‑2020) 손실이 발생한 필드를 식별하고, EUDR(유럽 연합 산림 파괴 규제) 준수 모니터링에 활용한다.
대규모 적용 사례로는 일본·멕시코·르와다·남아프리카·스위스 5개 국가에 대해 2023‑2024년 두 시즌, 두 연도에 걸친 Zarr 아카이브를 제공한다. 슬라이딩 윈도우(256×256 px, 25 % 겹침)와 가우시안 가중 평균을 통해 타일 경계 효과를 최소화하고, 결과를 Web Mercator(EPSG:3857) 좌표계로 바로 저장한다. 사용자는 전체 데이터를 다운로드하지 않고도 클라우드에서 직접 공간·시간 쿼리를 수행할 수 있다.
전체적으로 FTW는 데이터·모델·툴 체인을 일관되게 제공함으로써 연구자와 실무자가 손쉽게 필드 경계 추출, 작물 분류, 산림 손실 연계 분석을 수행하도록 지원한다. 특히 오픈소스 CLI와 Zarr 기반 클라우드 스토리지는 재현 가능성과 확장성을 크게 높이며, 향후 전 세계 농업 데이터 파이프라인 구축의 표준이 될 잠재력을 가진다.
댓글 및 학술 토론
Loading comments...
의견 남기기