미국에서 새로운 초대형 데이터센터를 건설할 수 있는 지역은 얼마나 남았나
초록
본 논문은 미국 전역을 대상으로 전력망, 기후·수문·지형·토지 이용 등 10여 가지 물리·인프라 제약을 통합한 25 km² 규모의 육각형(H3) 격자에서 현재 관측된 초대형 데이터센터 위치 패턴을 활용해 신규 건설 가능 지역을 추정한다. 비지도 유사도 모델과 커널 밀도 모델을 적용해 환경·전력 조건을 동시에 만족하는 영역을 도출하고, 이를 기반으로 미국 전체에서 물리적으로 수용 가능한 초대형 데이터센터 용량을 수십 기가와트 수준(약 24–78 GW)으로 제한한다.
상세 분석
이 연구는 초대형 데이터센터(하이퍼스케일) 구축이 전력망 접근성, 냉각 요구, 기후 위험, 수자원·홍수 위험, 지형·고도, 토지 피복, 보호구역, 인구·도시 밀도 등 복합적인 제약에 의해 강하게 제한된다는 가정을 바탕으로, “현존하는 입지 패턴”을 직접 관측해 제약‑우선(feasibility‑first) 접근법을 적용했다. 데이터는 미국 연방·주·민간 공개 소스를 전부 통합했으며, 전력선·변전소·발전소 위치, 고전압(≥115 kV) 전송선 거리·길이, 50 MW 이상 대형 발전소와의 거리·용량, PRISM 기후 정규값(평균 7월·최대 8월 기온), NHD 수역·습지·FEMA 홍수위험, USGS 고도·경사, NLCD 토지 피복, GHSL 인구·건축 밀도, PAD-US 보호구역 등을 9가지 범주에 걸쳐 정량화했다.
입지 분석의 기본 단위는 Uber의 H3 육각형 격자로, DBSCAN 군집 분석을 통해 23–27 km 반경(≈40–100 km²) 규모가 초대형 데이터센터 클러스터와 일치함을 확인하고, 이를 H3 해상도 4(헥사곤 면적 ≈25 km²)로 채택했다. 각 헥사곤에 대해 상한·하한 전력 수요 추정치를 기반으로 “고신뢰” 초대형(≥20 MW)·비초대형(≤5 MW) 라벨을 부여하고, 라벨이 불명확한 셀에 대해서는 전력 인프라 특성만을 이용한 이진 분류기를 학습시켜 불확실성을 최소화했다. 결과적으로 4,348개의 헥사곤 중 40개(0.9 %)만이 초대형 데이터센터로 확인되었으며, 현재 초대형 부하 총합은 약 4.5–5 GW(연간 40–45 TWh) 수준이다.
제약‑기반 적합성 평가는 두 가지 비지도 모델로 수행됐다. 첫 번째는 “유사도 기반” 모델로, 모든 정량 변수에 순위 기반 균등 스케일링을 적용하고, 초대형 헥사곤들의 특성 분포(환경·전력)에서 경험적 분위수를 추출해 거리‑기반 지수 커널로 유사도 점수를 계산했다. 환경·전력 유사도는 최소값을 취해 비보상(non‑compensatory) 방식으로 결합했으며, 최소·5th·10th 분위수 임계값을 사용해 보수적·중간·관대형 적합 영역을 정의했다. 두 번째는 “커널 밀도(KDE) 기반” 모델로, 초대형 헥사곤만을 대상으로 전력·환경 두 개의 독립 KDE를 추정하고, 역시 최소값을 취해 결합했다. 두 모델 모두 전력 인프라가 충분히 근접하지 않은 지역은 자동 배제되었다.
이러한 적합 영역에 기존 초대형 데이터센터의 전력 밀도(25th, median, 75th 분위수)를 적용하면, 현재 용량에 추가로 20–70 GW 정도가 물리적으로 수용 가능하다는 추정치가 나온다. 즉, 전체 미국에서 초대형 데이터센터가 실제로 배치될 수 있는 토지는 전체 토지의 1 % 미만이며, 잠재 용량은 수백 GW가 아니라 수십 GW 수준으로 크게 축소된다.
연구의 주요 한계는(1) 데이터센터 위치가 공개된 1,200여 개에 국한돼 있어 비공개 시설을 누락했을 가능성, (2) 전력망 용량·가격·규제·수자원 가용성 등 동적 요소를 정량화하지 않아 실제 투자 의사결정과 차이가 있을 수 있음, (3) H3 해상도 4의 공간 해상도가 지역별 세부 제약(예: 토지 소유권, 지역 전력 계약)까지 반영하기엔 부족함을 들 수 있다. 그럼에도 불구하고, 관측된 입지 패턴을 제약‑우선 프레임워크에 직접 매핑함으로써 “가능 토지”와 “가능 용량”을 물리·인프라 관점에서 명확히 제한한 점은 정책 입안자와 인프라 플래너에게 중요한 인사이트를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기