네트워크 기반 AI 서비스 세션: AIaaS의 새로운 계약 모델

네트워크 기반 AI 서비스 세션: AIaaS의 새로운 계약 모델
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 AI 추론 서비스를 네트워크와 결합한 “AI 세션(AIS)” 개념을 제안한다. 모델 식별, 실행 위치, QoS 흐름, 프라이버시·청구 범위를 하나의 계약 객체에 묶어, 지연 보장, 컴퓨팅·전송 자원 공동 예약, 이동성에 따른 무중단 마이그레이션을 가능하게 한다. AI 서비스 프로파일(ASP)로 측정 가능한 지연·성공 확률·속도 목표를 정의하고, DISCOVER·PAGING·PREPARE/COMMIT·MIGRATION 절차를 표준 API(CAPIF), MEC, 5G QoS 흐름, NWDAF와 매핑한다.

상세 분석

이 논문은 현재 AI‑as‑a‑Service가 “엔드포인트 중심”으로 운영돼 네트워크가 단순 전송만 담당한다는 근본적인 설계 결함을 지적한다. 그 결과 지연의 꼬리(타일‑퍼센타일) 보장이 불가능하고, 트래픽 폭주 시 큐 대기시간이 급증하거나, 사용자가 이동하면서 서비스 중단이 발생한다. 저자는 이러한 문제를 해결하기 위해 네트워크와 AI 서비스가 하나의 계약 체계 안에서 공동 관리되는 “AI 세션(AIS)”라는 새로운 원시 객체를 도입한다. AIS는 네 가지 핵심 속성을 하나의 라이프사이클에 바인딩한다. 첫째, 모델 식별 및 버전—서비스 제공자는 특정 모델과 그 버전을 명시하고, 이는 ASP에 의해 사전 검증된다. 둘째, 실행 앵커(Edge·Regional·Central)—AI Paging 단계에서 현재 네트워크 부하와 사용자 위치, 프라이버시 요구사항을 고려해 최적의 실행 지점을 선택한다. 셋째, 전송 QoS 흐름—5G QoS Flow(QFI)를 이용해 지연·손실·우선순위 등을 서비스 수준 협약(SLA) 수준에서 강제한다. 넷째, 동의·청구 범위—프라이버시/주권 제약과 과금 모델을 세션에 명시함으로써, 데이터 처리와 네트워크 사용에 대한 책임을 명확히 한다.

ASP는 측정 가능한 목표값(예: TTFB, p95/p99 지연, 성공 확률 ρ_min, 최대 타임아웃 T_max, 최소 처리율 ν_min)을 포함하고, 동시에 모델 종류·품질 등급·프라이버시·이동성 클래스·비용 범위·대체 경로와 같은 제약조건을 선언한다. 이러한 선언은 경계 측정 가능성을 보장해, 세션이 활성화된 동안 언제든지 목표 달성 여부를 검증할 수 있게 만든다.

프로토콜 설계는 다섯 단계로 구성된다. 1) DISCOVER – CAPIF 기반 카탈로그에서 ASP와 일치하는 모델·사이트 후보를 조회하고 순위화한다. 2) AI PAGING – NWDAF에서 실시간 트래픽·부하·이동성 정보를 받아, 가장 적합한 앵커를 선택한다. 3) PREPARE/COMMIT – 두 단계 트랜잭션으로 컴퓨팅 자원(예: MEC VM)과 QoS 흐름을 원자적으로 예약한다. 준비 단계에서 자원 가용성을 확인하고, 커밋 단계에서 실제 바인딩을 확정한다. 실패 시 전체 롤백이 보장된다. 4) SERVE – 세션 동안 측정값(TTFB, 지연, 성공률 등)을 실시간으로 NWDAF에 보고하고, 정책 엔진이 SLA 위반을 감지하면 즉시 재조정하거나 세션을 종료한다. 5) MIGRATION – 사용자가 다른 엣지 도메인으로 이동하면, 기존 세션을 “make‑before‑break” 방식으로 복제하고, 새로운 QoS 흐름을 설정한 뒤 기존 흐름을 해제한다. 이 과정은 세션 식별자와 계약 정보를 그대로 유지하므로, 청구·동의 정보가 손실되지 않는다.

표 Ⅰ에 정리된 10가지 요구사항(R1‑R10)은 각각 어느 표준 컴포넌트가 담당하는지를 명시한다. 예를 들어 R3(Atomic binding)은 CAPIF + MEC + 5G QoS Flow의 트랜잭션 메커니즘을 활용하고, R9(Diagnosable failures)는 NWDAF가 제공하는 오류 코드와 타이머를 통해 구현한다. 이러한 설계는 기존 3GPP·ETSI 표준을 크게 확장하지 않으면서도, AI 서비스에 필요한 컴퓨팅·전송·정책·분석 네 개의 제어 평면을 하나의 계약 객체에 결합한다는 점에서 혁신적이다.

시뮬레이션 결과는 부하 급증 시 전통적인 엔드포인트 방식이 p99 지연이 300 ms를 초과하는 반면, AIS 기반 NE‑AIaaS는 QoS 흐름과 엣지 재배치를 통해 150 ms 이하로 유지함을 보여준다. 또한 이동성 실험에서 세션 마이그레이션에 걸리는 중단 시간은 평균 12 ms에 불과해, 실시간 인터랙션 서비스에 충분히 적용 가능함을 입증한다.

결론적으로, 이 논문은 AI 서비스가 네트워크와 동일한 계약 기반 관리 체계에 포함될 수 있음을 증명하고, 향후 5G‑Beyond 및 멀티‑액세스 엣지 환경에서 AI‑native 서비스 오퍼링을 표준화하는 로드맵을 제시한다.


댓글 및 학술 토론

Loading comments...

의견 남기기