다중스케일 의미화 기반 LLM 지원 네트워크 건강 관리
초록
본 논문은 이기종 네트워크 환경에서 발생하는 다양한 규모의 KPI 변동을 통합적으로 처리하기 위해, 비지도 학습 기반 다중스케일 정규화와 의미 규칙 트리를 결합한 MSADM 프레임워크를 제안한다. 정규화된 상태 리스트를 LLM에 전달해 체인‑오브‑생각 방식으로 고품질 진단 보고서와 완화 방안을 자동 생성한다. 실험 결과, 기존 모델 대비 이상 탐지 정확도 97.09%, 고장 진단 정확도 89.42%를 달성하였다.
상세 분석
MSADM은 네트워크 건강 관리(NHM)의 전 과정을 엔드‑투‑엔드로 연결하는 파이프라인을 설계했다. 첫 단계에서는 이기종 장비가 제공하는 KPI(패킷 손실, 지연, 대역폭 등)의 스케일 차이를 해소하기 위해, 과거 정상 데이터에 대한 비지도 클러스터링을 수행하고, 각 KPI를 ‘low/medium/high’와 같은 의미적 상태 코드(LSS)로 매핑한다. 이 과정에서 평균, 분산, 진동(jitter), 트렌드 등 4가지 통계량을 추출하고, 트렌드는 구간별 극값 개수(N_ext)로 정량화한다. 동적 규칙 라이브러리는 새로운 장비가 추가될 때 자동 업데이트되며, 다중스케일 정규화 메커니즘은 기존의 단일 임계값 기반 방법이 갖는 정확도 저하 문제를 근본적으로 해결한다.
두 번째 단계는 정규화된 상태 리스트를 입력으로 하는 다중스케일 이상 탐지·진단 모델이다. 모델은 시간‑채널 어텐션 구조를 채택해, 시계열 내 장기 의존성과 서로 다른 KPI 간 상관관계를 동시에 학습한다. 특히, 각 채널(예: 노드별 KPI)마다 별도의 어텐션 헤드를 두어 스케일이 다른 특징을 독립적으로 강조하면서도, 최종 레이어에서 통합해 종합적인 이상 여부와 고장 유형을 출력한다. 기존 TranAD와 같은 단일‑스케일 트랜스포머와 비교했을 때, 다중스케일 어텐션은 이기종 네트워크에서 나타나는 비선형·비동질적 변동을 효과적으로 포착한다.
세 번째 단계는 ‘네트워크 의미화’라 명명한 의미 규칙 트리를 이용해, 정량적 상태 코드를 구조화된 자연어 서술문으로 변환한다. 예를 들어, “Node A의 패킷 손실이 high, 지연이 medium”과 같은 문장을 자동 생성함으로써, LLM이 이해하기 쉬운 형태로 정보를 제공한다. 이때 사용된 규칙 트리는 도메인 전문가가 정의한 KPI‑상태 매핑과, 상태 간 인과 관계(예: 높은 손실 → 대역폭 재할당 필요)를 포함한다.
마지막으로, 변환된 텍스트와 탐지·진단 결과를 프롬프트에 결합하고, 체인‑오브‑생각(Chain‑of‑Thought) 기법을 적용한 대형 언어 모델(LLM)을 호출한다. LLM은 입력을 단계별로 논리적으로 추론해, 원인 분석, 영향 평가, 구체적 완화 스크립트(예: “Node B의 트래픽을 20 % 감소시키고, 대역폭을 100 Mbps로 확대”)를 포함한 종합 보고서를 자동 생성한다. 실험에서는 실제 5G 기지국, 차량 네트워크, 드론 네트워크 데이터를 사용해, 기존 시계열 이상 탐지 모델 대비 탐지 정확도가 평균 9 %p 상승하고, 고장 진단 정확도가 22 %p 이상 개선됨을 확인했다. 또한, 의미 규칙 트리를 거친 후 LLM에 입력했을 때 보고서 가독성 점수가 1.8배 향상되었으며, 직접 원시 데이터를 입력했을 때보다 완화 제안의 실효성이 크게 높아졌다.
이러한 설계는 다중스케일 정규화, 의미화, LLM 기반 보고서 생성이라는 세 축을 결합함으로써, 이기종 네트워크 환경에서 인간 전문가가 수행하던 복잡한 진단·완화 과정을 자동화하고, 운영 비용을 크게 절감할 수 있음을 시사한다. 다만, 동적 규칙 라이브러리의 초기 학습 비용과 LLM 프롬프트 설계의 도메인 특화 요구사항, 실시간성 확보를 위한 경량화 방안 등은 향후 연구 과제로 남는다.
댓글 및 학술 토론
Loading comments...
의견 남기기