지속가능 미래를 위한 복합지수 개발을 위한 데이터 융합 및 집계 방법
초록
본 논문은 환경 위험 모델링에 사용되는 다수의 지표를 하나의 핵심 성과 지표(KPI)로 압축하기 위한 데이터 융합·가중치 부여 기법을 체계적으로 비교한다. 분산‑가중, 엔트로피‑가중, 주성분 분석(PCA), CRITIC, 그리고 처음으로 적용된 데이터 개발 분석(DEA) 등 다섯 가지 객관적 가중치 방법을 시뮬레이션과 실제 가뭄 회복력 사례에 적용해 장·단점을 평가한다. 결과는 각 방법이 데이터 분포·상관관계에 따라 가중치를 다르게 부여함을 보여주며, 특히 DEA는 시스템별 최적 가중치를 도출해 정책 설계에 유용함을 시사한다.
상세 분석
이 연구는 환경 위험 지수 구축 과정에서 ‘지표 선택’과 ‘가중치·집계 방법’ 두 축을 명확히 구분하고, 기존 문헌에서 주로 사용되어 온 주관적 가중치와 달리 객관적 가중치에 초점을 맞춘다. 먼저 분산‑가중 방식은 각 지표의 통계적 신뢰도를 반영해 가중치를 역분산으로 설정한다. 이는 변동성이 큰 지표에 낮은 가중치를 부여함으로써 전체 지수의 분산을 최소화하지만, 실제로는 정규화(min‑max) 전처리 후에는 분산 차이가 사라져 가중치가 거의 균등하게 된다. 엔트로피‑가중은 정보량을 기준으로 가중치를 산정한다. 높은 엔트로피는 불확실성이 크다는 의미이므로 가중치를 낮게 잡는다. 그러나 동일하게 정규화된 데이터에서는 엔트로피 차이가 축소돼 기대와 다른 균일 가중치가 도출된다. PCA 기반 가중치는 상관관계가 높은 지표들의 중복을 제거하고, 주요 주성분에 대한 기여도를 가중치로 전환한다. 이때 선택된 주성분 수와 해석 방식에 따라 가중치 분포가 크게 달라질 수 있다. CRITIC은 표준편차와 상관계수의 곱으로 ‘정보·충돌’ 점수를 계산해 가중치를 부여한다. 이 방법은 변동성이 큰 동시에 다른 지표와 상관성이 낮은 경우에 높은 가중치를 부여해 중복을 최소화한다. 가장 혁신적인 DEA는 각 시스템(지역·커뮤니티)을 ‘결정단위(DMU)’로 보고, 지표를 출력(output)으로, 가상의 입력을 1로 설정해 효율성 점수를 최대화한다. 각 DMU마다 최적 가중치를 구하고, 이를 평균해 전역 가중치를 도출한다. 따라서 DEA는 시스템별 특성을 반영한 가중치를 제공하면서도 전체 비교 가능성을 유지한다. 시뮬레이션 결과는 네 가지 시나리오(정규, 변동성 차이, 고상관, 구조적 상관)에서 각 방법의 가중치 안정성 및 민감도를 보여준다. 특히 고상관 시나리오에서 PCA는 한 개의 주성분만 사용해 중복을 효과적으로 제거했으며, DEA는 가장 큰 가중치 변동성을 보였지만 이는 각 DMU가 최적화된 가중치를 갖기 때문이었다. 전체적으로 데이터 전처리(정규화) 방식이 가중치 산출에 미치는 영향을 강조하며, 연구자는 정규화 전후의 차이를 고려한 가중치 선택이 필요함을 제언한다.
댓글 및 학술 토론
Loading comments...
의견 남기기