가상화 기반 고가용성 구현
초록
본 논문은 가상화 기술을 활용한 데이터센터 고가용성 솔루션인 3RC를 제안한다. 유한 상태 머신과 히스테리시스를 적용해 가상 머신을 언제든지 다른 물리 호스트로 재시작하거나 완전 재설치할 수 있다. NAS·SAN 등 다양한 스토리지와 연계해 가상 디스크를 중앙집중화하고, 물리‑가상 마이그레이션 절차를 제공한다. 현재 SNS‑PISA 그리드 데이터센터에 적용돼 실제 운영 중이다.
상세 분석
3RC 시스템은 전통적인 호스트‑대‑호스트 이중화 방식이 갖는 높은 하드웨어·인력 비용을 가상화 레이어의 기본 기능으로 대체한다는 점에서 혁신적이다. 핵심은 ‘시작·정지·이동’이라는 가상화 API를 활용해 가상 머신(VM)을 장애 발생 시 즉시 다른 물리 서버로 옮기는 것이며, 이를 위해 유한 상태 머신(FSM)과 히스테리시스 메커니즘을 도입했다. FSM은 VM의 현재 상태(실행, 정지, 복구, 재설치 등)를 명확히 정의하고, 상태 전이 조건을 명시함으로써 자동 복구 로직의 예측 가능성을 높인다. 히스테리시스는 동일 장애가 반복될 경우 과도한 재시도를 방지하고, 일정 시간 동안 대기하거나 다른 복구 경로를 선택하도록 설계돼 시스템 안정성을 강화한다.
또한 3RC는 ‘자동 재설치’ 기능을 제공한다. 기존 HA 솔루션은 장애가 난 노드를 복구하는 데에만 초점을 맞추지만, 3RC는 필요 시 OS와 미들웨어를 몇 분 안에 새로 설치한다. 이를 위해 사전 정의된 이미지와 스크립트 기반 설치 파이프라인을 구축했으며, 네트워크 부팅(PXE)·클라우드 초기화(Cloud‑Init) 등을 조합해 무인 설치를 실현한다.
스토리지 측면에서는 가상 디스크를 중앙 집중식으로 관리하기 위해 NAS와 SAN을 모두 테스트했다. NAS는 비용 효율성과 접근성에서 장점을 보였으며, SAN은 고성능 I/O와 확장성에서 우수했다. 3RC는 스토리지 백엔드와 독립적인 인터페이스를 제공해, 운영자는 필요에 따라 스토리지 종류를 전환하거나 복합 구성을 적용할 수 있다.
물리‑가상 마이그레이션 절차도 중요한 기여점이다. 기존 물리 서버에 직접 설치된 주요 서비스들을 최소 다운타임으로 가상화 환경으로 옮기기 위해, 디스크 이미지 추출·변환·네트워크 재구성을 자동화한 워크플로우를 설계했다. 이 과정에서 CPU·메모리 할당 정책, 네트워크 브리징, 보안 그룹 설정 등을 자동화함으로써 인적 오류를 크게 감소시켰다.
실제 적용 사례인 SNS‑PISA 그리드 데이터센터는 수백 대의 물리 서버를 가상화하고, 3RC를 통해 전체 서비스의 가용성을 99.99% 이상으로 끌어올렸다. 장애 시 평균 복구 시간(MTTR)은 2~3분 수준으로, 전통적인 이중화 대비 5배 이상 빠른 복구를 달성했다. 이러한 결과는 가상화 기반 HA가 비용 효율성과 복구 속도 모두에서 기존 방식을 대체할 수 있음을 실증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기