신용평가에서 공정성 강화 머신러닝 실험 연구
초록
본 논문은 신용평가에 적용되는 다양한 공정성‑인식 머신러닝 모델과 5개의 공개 금융 데이터셋을 대상으로, 전처리·학습·후처리 3가지 접근법과 7개의 대표적인 그룹 공정성 지표를 종합적으로 실험한다. 결과는 공정성‑인식 모델이 전통 분류기 대비 예측 정확도와 공정성 사이에서 보다 균형 잡힌 성능을 보임을 확인한다.
상세 분석
이 연구는 신용점수 모델링에서 발생할 수 있는 차별 문제를 정량화하고 완화하기 위한 체계적인 실험 프레임워크를 제시한다. 먼저 저자들은 신용점수 문제를 “좋은(+) vs 나쁜(–) 신용” 이진 분류로 정의하고, 보호 속성(S)으로 성별, 연령, 결혼 여부 등을 설정한다. 데이터 전처리 단계에서는 5개의 공개 데이터셋(신용 승인, 신용카드 고객, 기본 결제, 독일 신용, PA‑KDD 신용)을 선정했으며, 각 데이터는 최소 500개 이상의 샘플, 보호 속성 포함, 클래스 불균형 비율(IR) 등을 만족한다. 데이터 편향을 탐색하기 위해 베이지안 네트워크(BN)를 활용, 보호 속성과 클래스 사이의 직접·간접 연결을 시각화함으로써 잠재적 편향을 사전에 파악한다.
공정성‑인식 모델은 크게 전처리(LFR, DIR), 인‑처리(Agarwal, AdaFair), 후처리(EOP, CEP) 세 범주로 나뉜다. 전처리 방법은 데이터 자체를 변형해 공정성을 확보하고, 인‑처리 방법은 손실 함수에 공정성 제약을 추가하거나 비용‑민감 학습으로 변환한다. 후처리 방법은 학습된 모델의 출력만을 조정해 균형을 맞춘다. 이러한 6개 모델을 기존 로지스틱 회귀, 랜덤 포레스트, XGBoost 등 전통 분류기와 비교한다.
공정성 평가지표는 통계적 동등성(SP), 동등 기회(EO), 동등화된 오즈(EOd), 예측 동등성(PP), 예측 형평성(PE), 치료 동등성(TE), ABROCA 등 7가지로, 인용 횟수가 높은 순으로 선정하였다. 각 지표는 차별 정도를 0에 가깝게 만들수록 공정성이 높다고 해석한다.
실험 결과는 다음과 같다. 전처리 모델(LFR, DIR)은 데이터 변형으로 인해 일부 경우 정확도가 약간 감소했지만, SP와 EO 등 대부분의 지표에서 큰 개선을 보였다. 인‑처리 모델(Agarwal, AdaFair)은 정확도 손실이 최소화된 채로 공정성 지표를 현저히 낮추었으며, 특히 AdaFair는 클래스 불균형을 동시에 고려해 균형 잡힌 F1 점수를 제공한다. 후처리 모델(EOP, CEP)은 원본 모델의 정확도를 거의 유지하면서도 EO와 EOd를 크게 감소시켰다. 전체적으로 공정성‑인식 모델은 전통 모델 대비 평균 512% 수준의 정확도 감소를 감수하고, 주요 공정성 지표에서 2045% 개선을 달성했다. 특히 데이터셋별 특성(예: 독일 신용 데이터의 높은 성별 편향)과 보호 속성 조합에 따라 최적의 접근법이 달라지는 점을 강조한다.
한계점으로는(1) 보호 속성을 이진으로만 고려해 다중 보호 속성 교차 효과를 다루지 못함, (2) 실험에 사용된 5개 데이터셋이 주로 유럽·아시아 지역에 국한돼 글로벌 금융 환경 전반에 일반화하기 어려움, (3) 공정성‑정밀도 트레이드오프를 정량화하는 비용 함수 설계가 주관적이라는 점을 들 수 있다. 향후 연구에서는 다중 보호 속성, 연속형 공정성 제약, 그리고 규제 기관이 요구하는 법적 기준과의 정량적 매핑을 탐색할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기