신뢰를 통한 역량 회복 바르셀로나 무주택자 보건 정책 시뮬레이션
초록
본 논문은 바르셀로나의 무주택자를 대상으로, 능력 접근법(Capability Approach)을 기반으로 한 강화학습 기반 에이전트 기반 모델을 구축하고, 사회복지사와의 신뢰 형성이 보건 서비스 접근성에 미치는 영향을 베이지안 역강화학습으로 보정한다. 정책 시뮬레이션을 통해 신뢰 구축이 건강 격차 완화에 기여함을 보인다.
상세 분석
이 연구는 사회정책 평가에 에이전트 기반 시뮬레이션(ABM)을 적용하면서, 기존의 효용극대화 모델을 넘어 능력 접근법(CA)을 정량화한다는 점에서 혁신적이다. CA의 핵심인 ‘중심 역량(central capabilities)’을 상태·행동 공간에 매핑하고, 각 역량에 가중치(α_k)를 부여해 정책 효과를 다차원적으로 평가한다. 에이전트는 ‘신뢰(trust)’라는 선택 요인(choice factor)을 보상함수에 포함시켜, 사회복지사와의 교류 여부가 행동 선택에 미치는 영향을 모델링한다. 베이지안 역강화학습(IRL)을 활용해 실제 정책 담당자와 현장 전문가가 제공한 관찰 데이터로 프로파일 별 행동 파라미터를 추정함으로써, 에이전트의 내재적 동기를 데이터 기반으로 보정한다. 이는 전통적인 파라미터 튜닝 방식보다 더 정교한 캘리브레이션을 가능하게 하며, 개별 에이전트 수준과 시스템 수준 결과를 동시에 최적화한다는 장점을 가진다. 모델은 물리적 환경(보건소·거리 outreach 팀 위치), 규제 환경(주민 등록 정책), 그리고 개인 특성(무주택 기간, 트라우마 이력 등)을 MDP의 상태와 전이 확률에 반영한다. 행동 집합은 ‘PHC(Primary Health Care) 요청·수신’, ‘사회복지 서비스 참여’, ‘응급 치료 수용’ 등으로 정의되고, 각각은 특정 역량(예: 신체 건강, 소속감, 실존적 이유)에 연결된 보상을 가진다. 정책 시나리오(예: 사회복지사 인력 증대, 등록 절차 완화)를 적용하면, 신뢰 구축 행동의 성공 확률이 상승하고, 결과적으로 건강 상태와 등록률이 개선되는 것을 시뮬레이션한다. 실험 결과는 신뢰 기반 행동이 없을 때 대비, 의료비용 절감과 역량 회복 지표가 유의미하게 향상됨을 보여준다. 이와 같이, 능력 접근법을 강화학습과 베이지안 IRL에 통합한 프레임워크는 복합 사회문제에 대한 정책 대안을 정량적·정성적으로 동시에 평가할 수 있는 새로운 도구로 평가된다.
댓글 및 학술 토론
Loading comments...
의견 남기기