다중포트 스캐터러 부하 예측을 위한 클러스터‑예측 프레임워크 최적화
초록
본 논문은 다중포트 스캐터러의 부하 임피던스 예측을 위해 두 단계의 클러스터‑예측 구조를 제안한다. 데이터 전체를 사전 클러스터링한 뒤 각 클러스터별 회귀 모델을 학습함으로써, 특히 Gradient Boosting(GB)에서 RMSE를 최대 46 % 감소시켰다. 또한 서로 다른 평가 지표들을 통합하는 Real‑world Unified Index(RUI)를 도입해 K‑means + KNN 조합이 전체 성능과 실시간 요구를 가장 잘 만족함을 확인하였다.
상세 분석
이 연구는 다중포트 전자기 스캐터러의 부하값(임피던스) 예측이라는 고차원·고상관성 문제에 ‘divide‑and‑conquer’ 전략을 적용한 점이 핵심이다. 먼저 전체 학습 데이터를 K‑means 혹은 Optimal Transport 기반 K‑means(O T K‑means)로 클러스터링한다. 클러스터링 단계는 데이터의 변동성을 감소시켜 각 서브셋이 보다 동질적인 특성을 갖게 함으로써, 이후 회귀 모델이 잡아야 할 함수 형태를 단순화한다. 이때 클러스터 수는 실험적으로 5~200 사이를 탐색했으며, 실루엣 점수와 RMSE, 예측 시간 등을 종합적으로 고려해 최적값을 도출하였다.
클러스터링 후 회귀 단계에서는 Gradient Boosting(XGBoost)과 k‑Nearest Neighbors(KNN)를 각각 다중출력 형태와 단일출력 형태로 적용하였다. GB는 복잡한 비선형 관계를 잘 포착하지만, 다중부하 상황에서는 고분산 특성에 과도히 의존해 성능이 저하되는 경향이 있었다. 클러스터링을 통해 데이터 분산을 줄이면 GB의 학습 효율이 크게 향상되어 RMSE가 46 % 감소하였다. 반면 KNN은 이웃 구조가 클러스터 경계에서 깨질 위험이 있어, 클러스터링이 오히려 약간의 성능 저하를 초래했지만, 기본적인 정확도는 이미 높은 수준이었으며 예측 시간도 거의 변하지 않아 실시간 적용에 유리했다.
또한 저자들은 다중 목표 평가를 위해 RUI를 정의하였다. RUI는 최대화·최소화가 혼재된 여러 지표(RMSE, 실루엣 점수, 예측 시간)를 0~1로 정규화한 뒤 가중합으로 통합한다. 전역 RUI와 지역 RUI(각 방법별) 두 가지 스케일을 사용해 최적 클러스터 수와 최적 모델 조합을 선정했으며, 가중치는 클러스터 품질(0.3), 정확도(0.4), 시간(0.3)으로 설정하였다. 이 결과 K‑means + KNN(k=3,9)이 전역 RUI 0.998로 가장 높은 점수를 받아 실시간 시스템에 가장 적합한 구성으로 판단되었다.
추가 실험에서는 DBSCAN·Mean Shift와 같은 비구형 클러스터링, 그리고 Linear Regression·Lasso·Linear SVR과 같은 선형 회귀 모델을 결합했을 때도 전반적으로 RMSE와 R²가 개선되는 경향을 보였다. 특히 선형 모델은 O T K‑means와 결합했을 때 성능 향상이 두드러졌지만, 절대적인 정확도는 GB·KNN에 비해 낮았다.
전체적으로 이 논문은 (1) 클러스터링을 통한 데이터 전처리로 고차원 전자기 문제의 회귀 성능을 크게 끌어올릴 수 있음을, (2) 다양한 평가 지표를 하나의 통합 지표(RUI)로 정량화함으로써 실용적인 설계 선택을 가능하게 함을, (3) K‑means와 KNN의 조합이 실시간 RIS·백스캐터링 시스템 등에 가장 적합한 솔루션임을 입증하였다. 향후 연구는 부하 수가 더 많은 경우와 부하→S‑parameter 역예측 문제에 클러스터‑예측 프레임워크를 확장하는 방향으로 진행될 예정이다.
댓글 및 학술 토론
Loading comments...
의견 남기기