신용위험 재발 이벤트 Cox 모델을 활용한 평생 부도 확률 추정 튜토리얼
초록
본 논문은 대출의 평생 부도 확률(PD)을 보다 정확히 추정하기 위해 재발 부도 이벤트를 포함하는 Cox 비례위험 모델을 소개한다. Andersen‑Gill(AG)와 Prentice‑Williams‑Peterson(PWP) 두 가지 스펠‑타임 모델을 실제 데이터에 적용하고, 최초 부도만 고려한 TFD 모델과 비교한다. 모델 성능은 Harrell’s C, Cox‑Snell 잔차, 시간‑의존 ROC 등으로 평가하며, 포트폴리오 수준의 부도 위험 term‑structure를 도출한다. 결과는 PWP와 TFD가 유사한 진단 지표를 보인 반면, AG 모델은 기대에 못 미쳤음을 보여준다.
상세 분석
이 연구는 신용 포트폴리오의 평생 부도 위험을 동적으로 추정하려는 실무·규제 요구에 부응하기 위해, 기존에 일회성 부도만을 모델링하던 Cox 비례위험(Cox‑PH) 접근법의 한계를 짚고 있다. 저자는 재발 부도(re‑default) 현상을 ‘스펠(spell)’이라는 시간 구간으로 정의하고, 각 스펠을 독립적인 위험 구간으로 취급하는 두 가지 재발 이벤트 서바이벌 모델을 도입한다. 첫 번째인 Andersen‑Gill(AG) 모델은 모든 스펠에 동일한 기준 위험(baseline hazard)을 가정하고, 이벤트 발생 횟수를 카운팅 프로세스로 확장한다. 이는 이벤트 간 독립성을 전제로 하지만, 실제 신용 상황에서는 스펠마다 위험 수준이 변동할 가능성이 크다. 두 번째인 Prentice‑Williams‑Peterson(PWP) 모델은 스펠 번호에 따라 데이터를 층화(stratify)하고, 각 층마다 별도의 기준 위험을 추정한다. 특히 ‘gap‑time’ 형식을 채택해 스펠 시작 시점을 0으로 재설정함으로써, 스펠 간 위험 변화와 스펠‑특정 공변량 효과를 동시에 포착한다.
데이터는 남아프리카공화국의 소매 대출을 대상으로, 대출 개별의 월말 상환 상태를 추적해 다중 스펠 구조를 구축하였다. 변수에는 차주 특성, 대출 특성, 거시경제 지표 등이 포함돼 고차원 입력 공간을 제공한다. 모델 적합 후, 저자는 Harrell’s C‑statistic을 통해 판별력을 평가하고, Cox‑Snell 잔차를 보정해 모델 적합도를 시각화한다. 또한, 기존 ROC 분석이 검열(censoring) 문제를 무시하는 한계를 극복하기 위해 시간‑의존 ROC(tROC)과 그 확장인 time‑dependent ROC(tR‑OC)를 적용, 재발 이벤트가 포함된 모델의 예측 성능을 정량화한다.
실험 결과, PWP‑GT 모델은 AG 모델에 비해 C‑값과 tR‑OC 곡선에서 일관적으로 우수했으며, 특히 스펠별 위험 차이를 반영함으로써 재발 부도 위험을 보다 현실적으로 추정했다. 반면 AG 모델은 동일한 기준 위험 가정이 부적절함을 보여, C‑값이 낮고 잔차 패턴에서도 시스템적 편향이 관찰되었다. 흥미롭게도, 최초 부도만을 고려한 TFD 모델과 PWP 모델은 통계적으로 유의한 차이를 보이지 않아, 실무에서 복잡한 재발 모델을 도입할 필요성을 상황에 따라 판단하도록 제시한다.
또한, 저자는 각 모델에서 추정된 위험 함수를 포트폴리오 수준의 term‑structure(시간에 따른 한계 부도 확률)로 변환하는 절차를 제시한다. 이는 IFRS 9의 기대 손실(ECL) 계산에 직접 활용될 수 있어, 회계·규제 관점에서도 실용적이다. 마지막으로, 코드베이스와 상세 데이터 전처리 과정을 공개함으로써 재현 가능성을 높이고, 향후 연구자·실무자가 손쉽게 적용·확장할 수 있는 토대를 마련했다.
댓글 및 학술 토론
Loading comments...
의견 남기기