다중 조직 장애 관리 아키텍처: 기능·조직 핵심 요소 분석
본 논문은 다중 조직 환경에서의 장애 관리(ioFM)를 지원하기 위한 관리 아키텍처(ioFMA)를 설계·분석한다. MDA 기반 모델링, FCAPS 하위 모델 확장, 그리고 실제 계층형·이종형 시나리오(IntegraTUM, GÉANT)를 통한 요구사항 도출 과정을 제시한다.
저자: Patricia Marcu, Wolfgang Hommel
논문은 IT 서비스 아웃소싱이 보편화되면서 서비스가 여러 외부 제공자에 분산되는 현상을 배경으로, 이러한 다중 조직 환경에서 장애를 신속하고 정확하게 탐지·진단·복구하기 위한 관리 아키텍처(ioFMA)를 제시한다. 서론에서는 아웃소싱 문제, 다중 도메인 이질성·자율성, 서비스 전달 다양성이라는 세 가지 핵심 도전 과제를 제시하고, Figure 1을 통해 계층형(수직)과 이종형(수평) 서비스 체인의 차이를 시각화한다. 이어 관련 연구에서는 Hegering 등(2005)의 관리 아키텍처(MA)와 그 네 서브모델(정보, 조직, 통신, 기능)을 소개하고, ITIL v3, ISO/IEC 20000, eTOM 등 기존 ITSM 프레임워크가 주로 계층형 서비스에 초점을 맞추고 있음을 지적한다. 서비스 구성 이론(수직·수평 공급망)과 기존 장애 관리 연구(패턴 기반 문제 탐지, 인시던트 티켓 연계)도 검토하면서, 이들 접근법이 다중 조직·이종 환경을 충분히 다루지 못한다는 점을 강조한다.
설계 절차는 모델 주도 아키텍처(MDA)를 채택한다. CIM 단계에서는 두 실제 사례를 분석한다. 첫 번째는 독일 TUM‑LRZ 간의 계층형 서비스 통합 프로젝트인 IntegraTUM으로, 중앙화된 인증·서비스 제공과 전통적인 장애 관리 프로세스가 적용된다. 두 번째는 유럽 연구 네트워크 GÉANT의 End‑to‑End 링크 서비스로, 34개 국가 NREN이 동등한 파트너십을 이루는 이종형 구조이며, 장애가 발생하면 여러 파트너에 동시에 영향을 미친다. 이 두 시나리오를 일반화해 ‘서비스 파트’, ‘서비스 레이어’, ‘고객’이라는 개념을 도출하고, 12개의 구체적 사용 사례와 30여 개의 기능·비기능 요구사항을 정의한다.
PIM 단계에서는 먼저 기능 모델을 설계한다. 여기서는 장애 탐지, 원인 분석, 상관관계 매핑, 복구 조정, 진행 상황 추적, SLA 기반 알림 등 기존 FCAPS의 ‘Fault’ 영역을 확장한다. 조직 모델에서는 ‘서비스 제공자’, ‘고객’, ‘중재자(조정자)’, ‘운영팀’ 등 역할을 정의하고, 각 역할의 책임과 권한을 명시한다. 통신 모델은 표준화된 REST/JSON 인터페이스와 메시지 큐 기반 비동기 통신을 제안하며, 보안·인증 메커니즘을 포함한다. 정보 모델은 장애 이벤트, 타임스탬프, 영향도, 관련 티켓 ID 등을 포함하는 스키마를 설계하고, 데이터 교환 포맷을 정의한다.
마지막으로 PSM 단계에서는 설계된 모델을 실제 플랫폼에 매핑한다. 예를 들어, ITIL 기반 티켓 시스템(Jira, ServiceNow)과 네트워크 관리 시스템(NMS) 간의 연동, 그리고 다중 조직 간의 신뢰 관계를 위한 PKI 기반 인증 체계를 제시한다.
결론에서는 ioFMA가 다중 조직 환경에서 장애 관리의 복잡성을 감소시키고, 서비스 가용성을 향상시킬 수 있음을 강조한다. 향후 연구 과제로는 실제 구현 및 성능 평가, 법·규제·프라이버시 고려사항 통합, 그리고 AI 기반 자동화 확장 등을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기