COVID‑19 팬데믹 억제를 위한 백신 프로그램의 최적 거버넌스와 실행

초록

본 논문은 백신 가용성·인력 부족·접종 회피 현상이 심각한 상황에서, 게임 이론과 사회 네트워크 모델을 활용해 백신 우선순위와 접종율을 최적화하는 정책 프레임워크를 제시한다. 불확실성과 불완전 정보 하에서 조건부 최적 해를 도출함으로써, 각국 보건당국이 실시간으로 정책을 조정하고 전염병 통제를 극대화할 수 있음을 강조한다.

상세 요약

이 연구는 코로나19 백신 보급 초기 단계에서 나타나는 ‘자원 제약(백신·인력)’과 ‘행동 제약(백신 회피)’이라는 두 축의 난제를 게임 이론적 접근으로 통합한다. 먼저, 저자들은 백신 배분을 ‘제한된 자원 게임’으로 모델링하고, 각 국가·지역을 ‘플레이어’로 설정한다. 이때 플레이어의 전략 집합은 ‘우선순위 그룹 지정(고위험군, 필수노동자, 일반인 등)’과 ‘접종 속도 조절’로 구성된다. 효용 함수는 (1) 감염 억제 효과, (2) 경제적 비용, (3) 사회적 신뢰도 손실을 포함한 다목적 형태이며, 파라미터는 실시간 역학 데이터와 설문 기반 회피율을 통해 추정한다.

사회 네트워크 모델은 개인 간 접촉 구조를 반영해 백신 회피가 전파되는 메커니즘을 정량화한다. 저자들은 ‘스케일프리 네트워크’를 가정하고, 핵심 허브 노드(예: 대규모 직장, 학교)에서의 접종률 변동이 전체 네트워크의 임계 전염율(R₀) 감소에 미치는 영향을 시뮬레이션한다. 결과는 ‘허브 중심 전략’이 일반적인 무작위 접종보다 30 % 이상 효율적임을 보여준다.

불확실성 하에서는 베이지안 업데이트를 통해 사전 확률(예: 백신 효능, 변이 발생률)을 지속적으로 갱신한다. 저자들은 ‘조건부 최적 정책(Conditional Optimal Policy, COP)’이라는 개념을 도입해, 현재 정보에 기반한 최적 전략을 도출하고, 새로운 데이터가 들어올 때마다 정책을 재조정한다. 이는 ‘마르코프 결정 과정(MDP)’과 ‘강화 학습(RL)’ 기법을 결합한 하이브리드 프레임워크로 구현된다.

핵심 인사이트는 다음과 같다. 첫째, 백신 배분은 단순히 ‘우선순위’만이 아니라 ‘시간에 따른 동적 조정’이 필요하다. 둘째, 사회 네트워크 중심의 타깃 접종은 회피가 높은 집단에서도 전파 억제 효과를 크게 높인다. 셋째, 불완전 정보와 변이 위험을 고려한 베이지안‑강화학습 기반 정책은 장기적인 비용-효과를 최적화한다. 마지막으로, 정책 입안자는 게임 이론적 균형(예: 내시 균형)과 사회적 최적(사회 복지 함수) 사이의 ‘갭’을 최소화하는 메커니즘을 설계해야 한다는 점을 강조한다.

초록

상세 요약

📜 논문 원문 (영문)