풍력터빈 결함 진단을 위한 지도 전이 학습 프레임워크
초록
본 논문은 SCADA와 진동 데이터를 활용해 만든 “Anomaly‑Space”를 기반으로, 라벨이 부족한 풍력터빈 환경에서 지도 전이 학습을 적용한다. 5대 터빈(4개 풍력단지)에서 수집한 학습 데이터를 이용해 Random Forest, LightGBM, MLP 등 세 가지 분류기를 비교했으며, 다층 퍼셉트론(MLP)이 가장 높은 F0.5 점수를 기록하였다. 최적 모델을 전체 학습 데이터에 재학습시킨 뒤, 전혀 다른 풍력단지의 2대 터빈 테스트 세트에 적용해 0.937의 F0.5 점수를 달성, 단일 분류기로 교차 도메인 결함을 정확히 탐지할 수 있음을 입증한다.
상세 분석
이 연구는 풍력터빈 결함 진단에서 가장 큰 두 가지 제약인 라벨 부족과 도메인 별 모델 다중화를 동시에 해결하려는 시도이다. 기존 전이 학습 방법들은 보통 소량의 라벨링된 타깃 데이터가 필요하거나, 딥러닝 기반 특징이 해석 불가능한 ‘블랙박스’ 형태로 제공된다. 여기서는 두 종류의 센서(SCADA, 진동) 데이터를 사전 정의된 탐지기(detector)들을 통해 정규화된 이상 점수(anomaly score)로 변환한 “Anomaly‑Space”를 도입함으로써, 도메인 간 공통 특징을 명시적으로 설계하였다. 이 공간은 각 부품별 정상·비정상 임계값(>1.0)을 직관적으로 보여주어 현장 엔지니어가 결과를 쉽게 이해하고 검증할 수 있다.
데이터 전처리 단계에서는 결함 발생 구간과 정상 구간을 시간 기반으로 라벨링하고, 결함 구간 외의 비정상 운전(정지, 저풍속 등)은 제외하였다. 결측값은 3시간까지 전방 채우기(forward fill) 후, 남은 구간은 0.0으로 대체해 연속적인 시계열을 확보하였다. 두 탐지기(bbcv, tuplet) 각각에서 가장 변동성이 큰 하나의 특성만을 선택해 차원 수를 2로 축소했으며, 이후 144시간(6일) 윈도우를 슬라이딩하여 추세 확신도(tc)와 분산(v) 두 가지 파생 특성을 추가, 최종 6차원 피처 벡터를 구성하였다.
모델 학습에는 3‑fold 층화 교차 검증을 적용하고, 평가 지표로 β=0.5인 Fβ‑score를 선택해 정밀도에 가중치를 부여하였다. 이는 풍력터빈 운영에서 오탐(false positive)으로 인한 불필요한 정비 비용을 최소화하려는 실무적 요구와 일치한다. 비교 결과, Random Forest와 LightGBM은 각각 0.81, 0.84 수준의 F0.5 점수를 기록했으나, MLP는 0.874로 가장 우수하였다. MLP는 ReLU 활성화, Adam 옵티마이저, 학습률 0.001, 은닉층 1개(노드 5개)라는 비교적 단순한 구조임에도 불구하고, 비선형 관계를 효과적으로 포착해 높은 정밀도(0.992)와 적절한 재현율(0.789)을 동시에 달성했다.
최종 테스트에서는 학습된 MLP를 전체 학습 데이터에 재학습시킨 뒤, 전혀 새로운 풍력단지의 두 터빈에 적용하였다. 테스트 결과 F0.5 점수 0.937, F1 점수 0.871, 정밀도 0.992, 재현율 0.789을 기록했으며, 이는 학습 데이터보다 품질이 낮은 테스트 데이터에서도 모델이 강인함을 보여준다. 저품질 라벨링(예: 느슨한 접촉 센서 결함)으로 인한 혼란을 최소화하기 위해 윈도우 크기 확대 혹은 결함 구간 세분화와 같은 향후 개선 방안을 제시하였다.
핵심 인사이트는 (1) 도메인 간 공통 특징을 사전에 정의된 이상 점수 형태로 변환함으로써 라벨이 거의 없는 상황에서도 효과적인 전이 학습이 가능하다는 점, (2) 단일 다층 퍼셉트론 모델 하나만으로도 다양한 터빈·풍력단지에 걸친 결함 유형을 높은 정확도로 진단할 수 있다는 점, (3) 이상 점수 기반 특징이 해석 가능성을 제공해 현장 엔지니어와의 협업을 촉진한다는 점이다. 이러한 접근은 풍력터빈뿐 아니라 다른 산업 설비에서도 라벨링 비용을 크게 절감하면서 신뢰성 있는 고장 진단 시스템을 구축하는 데 적용 가능할 것으로 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기