대규모 전력망 이상 탐지를 위한 머신러닝 비교 연구

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 스위스·스페인·독일 3개 대형 고전압 전송망을 대상으로 9가지 지도·비지도 학습 알고리즘을 적용해 전력 생산·소비 시계열 데이터의 이상 탐지 성능을 비교한다. 특히 수문발전소와 같은 변동성이 큰 발전원을 중심으로 ‘컨텍스트 이상’(다른 설비와의 상대적 상황에서 발생하는 이상)을 탐지하는 데 신경망이 우수함을 확인하고, Isolation Forest와 Auto‑Encoder 기반 비지도 방법도 다중 동시 이상 상황에 강인함을 보였다.

상세 분석

논문은 먼저 전력망의 구조적 변화를 서술하고, 탈탄소화와 분산형 재생에너지 확대가 전력 시스템을 한계에 가깝게 운영하도록 만든다. 이러한 운영 환경에서는 실시간으로 발생하는 데이터 이상을 빠르게 식별해야 하며, 전통적인 통계적 방법은 다변량 상관관계와 컨텍스트 의존성을 충분히 포착하지 못한다는 점을 강조한다. 이를 해결하기 위해 9가지 머신러닝 알고리즘—k‑NN, SVM, Random Forest, Gradient Boosting, Isolation Forest, PCA, 다층 퍼셉트론(MLP), Convolutional Neural Network(CNN), Long Short‑Term Memory(LSTM)—을 선정하고, 각각을 동일한 데이터셋에 적용해 성능을 정량화하였다.

데이터셋은 20년치 시간해상도(1시간) 전력 생산·소비 시계열을 포함하며, 스위스(163 bus + 36 발전소), 스페인(908 bus + 61 발전소), 독일(560 bus + 101 발전소) 세 국가의 전송망을 모델링한다. 특히 변동성이 큰 수문발전소 10곳(스위스), 9곳(스페인)과 가스·석탄 발전소를 선택해 ‘on/off’ 형태의 가짜 데이터 주입 공격 시나리오를 만든다. 공격은 실제 출력이 정격의 절반 이하일 때 전력을 전부 생산한 것으로, 혹은 정격의 절반 이상일 때 전력을 0으로 보고하는 방식으로, 최대 전력 차이를 유발하도록 설계되었다.

지도 학습에서는 10 %의 시점에 이러한 공격을 삽입해 라벨을 부여하고, F₂‑score(Recall에 가중)로 평가한다. 실험 결과, 딥러닝 기반 모델(LSTM, CNN)은 특히 긴 히스토리(24 시간)와 전체 전력 주입(생산 + 소비) 컨텍스트를 입력으로 사용했을 때 F₂가 0.92 ~ 0.96으로 가장 높은 성능을 보였다. 반면 k‑NN과 SVM은 입력 차원이 커질수록 차원의 저주와 거리 측정의 불안정성으로 성능이 급격히 저하되었다. Random Forest와 Gradient Boosting은 중간 정도의 성능을 보였지만, 하이퍼파라미터 튜닝에 민감했다.

비지도 학습에서는 Isolation Forest와 Auto‑Encoder를 적용해 정상 데이터의 재구성 오차 혹은 트리 깊이 기반 이상 점수를 산출했다. 특히 다중 동시 공격(여러 발전소가 동시에 변조) 상황에서도 두 알고리즘은 높은 검출률(>85 %)과 낮은 오탐률(<10 %)을 유지했으며, 이는 정상 데이터 분포를 학습한 뒤 이상을 ‘희소점’으로 인식하는 방식이 컨텍스트 이상에 강인함을 의미한다.

입력 설계 측면에서 저자들은 ‘컨텍스트(전체 전력 주입 vs. 생산만)’와 ‘히스토리 길이(0, 4 h, 24 h)’의 조합을 체계적으로 탐색했다. 결과적으로, 과도한 입력(예: 전체 1000 개 이상의 변수와 24 시간 히스토리)을 제공하면 모델이 과적합하거나 학습 시간이 비현실적으로 늘어나 성능이 감소한다는 ‘정보 과부하’ 현상을 확인했다. 최적의 설정은 (1) 전체 전력 주입을 포함한 중간 규모 컨텍스트(예: 스페인 ≈ 968 변수), (2) 4 ~ 24 시간 히스토리, (3) 딥러닝 모델의 경우 배치 정규화와 드롭아웃을 적용한 구조였다.

또한, 논문은 실험 결과를 바탕으로 다음과 같은 실무적 교훈을 제시한다. 첫째, 컨텍스트 이상을 탐지하려면 개별 설비의 절대값이 아니라 전체 시스템과의 상대적 관계를 학습해야 하므로, 입력에 주변 설비 데이터를 반드시 포함해야 한다. 둘째, 실시간 적용을 고려하면 딥러닝 모델은 GPU 가속이 필요하지만, Isolation Forest와 같은 경량 비지도 모델은 CPU만으로도 충분히 빠른 탐지가 가능해 초기 경보 시스템에 적합하다. 셋째, 데이터 전처리 단계에서 계절성·주기성을 제거하고 정규화하는 것이 모든 모델의 성능을 평균 5 % 이상 향상시켰다. 마지막으로, 다중 동시 공격 시나리오를 시뮬레이션해 검증함으로써 모델의 강인성을 사전에 평가할 필요가 있다.

전반적으로 본 연구는 대규모 전력망에서 머신러닝 기반 이상 탐지 시스템을 설계할 때, 알고리즘 선택, 입력 설계, 하이퍼파라미터 튜닝, 그리고 비지도·지도 학습의 조합이 핵심 요소임을 실증적으로 보여준다.

대규모 전력망 이상 탐지를 위한 머신러닝 비교 연구

초록

상세 분석

댓글 및 학술 토론

의견 남기기