트랙터블 모델을 활용한 머신러닝 공정성 연구

본 논문은 머신러닝 시스템이 사회적·법적 보호 속성(예: 성별, 인종, 연령 등)에 대해 편향된 결정을 내리는 문제에 주목한다. 기존 공정성 연구는 ‘공정성 무지(Fairness through Unawareness)’, ‘인구통계적 평등(Demographic Parity)’, ‘예측 균형(Predictive Parity)’ 등 다양한 정의를 제시했지만, 이러한 정의들은 서로 상충하거나 보호 속성과 다른 특성 간의 복잡한 통계적 의존성을 충분히 반영하지 못한다는 비판을 받아왔다. 특히, 보호 속성에 대한 직접적인 정보가 모델에 제공되지 않더라도, 다른 변수들을 통해 간접적으로 편향이 전파될 위험이 존재한다. 이러한 문제를 해결하기 위해 저자들은 ‘트랙터블 확률 모델(Tractable Probabilistic Models)’이라는 최신 연구 흐름을 도입한다. 트랙터블 모델은 전체 확률분포를 압축적으로 표현하면서도, 조건부 주변분포를 선형 시간에 정확히 계산할 수 있는 특성을 갖는다. 대표적인 예가 합곱 네트워크(Sum‑Product Networks, SPN)이며, 이는 합산·곱셈 연산을 트리 구조로 결합해 복잡한 고차원 분포를 효율적으로 추정한다. 논문의 핵심 아이디어는 다음과 같다. 먼저, 원본 데이터(보호 속성 포함)로 SPN을 학습한다. 학습된 SPN을 이용해 보호 속성 aₚ와 각 특성 Xᵢ 사이의 조건부 의존성을 정량화한다. 구체적으로, P(Xᵢ | aₚ)와 P(Xᵢ) 사이의 차이를 마진 연산을 통해 빠르게 계산하고, 통계적 독립성 검정을 수행한다. 이 과정에서 보호 속성과 독립적인 변수 집합 S를 ‘안전 변수(safe variables)’로 식별한다. 다음 단계에서는 안전 변수를 이용해 최종 분류기를 학습한다. 여기서 중요한 점은 보호 속성이 다른 변수에 미치는 기여를 보정한다는 것이다. 수치형 변수에 대해서는 보호 속성에 대한 조건부 평균 차이를 빼는 방식으로, 범주형 변수에 대해서는 조건부 확률을 재조정하는 방식으로 변환한다. 이렇게 변환된 데이터는 보호 속성에 의해 발생하는 직접·간접 편향을 최소화한 형태가 된다. 하지만 단순히 평균 차이를 보정하는 방식은 보호 속성의 비선형·다중 상호작용을 충분히 반영하지 못한다는 한계가 있다. 이를 보완하기 위해 저자들은 ‘백분위 동등성(Fairness through Percentile Equivalence)’이라는 새로운 공정성 정의를 제안한다. 이 정의는 “동일 백분위에 위치한 개인은 동일하게 대우받아야 한다”는 원칙에 기반한다. 구체적으로, 보호 속성에 조건부로 정의된 누적분포함수(CDF)를 이용해 각 샘플을 해당 백분위에 매핑하고, 동일 백분위 간 차이를 최소화하도록 데이터를 재조정한다. 이 방법은 특히 분포의 극단값(예: 최하위 5%에 해당하는 신청자)에서 발생할 수 있는 과도한 보정(과소·과대 평가)을 방지한다. 실험은 두 가지 주요 데이터셋을 사용한다. 첫 번째는 독일 신용 데이터셋(German Credit)으로, 성별에 따른 차별을 측정한다. ‘공정성 무지’ baseline와 비교했을 때, SPN 기반 사전 처리 후 남·여 승인율 차이는 12%p에서 3%p로 크게 감소했으며, 전체 정확도는 0.5%p 정도만 감소하였다. 두 번째는 법학대학원 지원자 데이터셋으로, 인종(흑인·백인)과 시험 점수 간의 불균형을 평가한다. 백분위 동등성 보정을 적용한 결과, 소수 집단(흑인) 중 하위 10%에 해당하는 지원자의 점수 언더에스티메이션이 약 20% 감소하였다. 논문은 또한 기존 연구와의 차별점을 명확히 한다. Feldman et al. (2015)의 선형 보정 방법과 달리, SPN을 이용한 비선형 의존성 탐지는 더 정교한 변수 선택을 가능하게 하며, 백분위 동등성은 평균 기반 보정이 놓치는 극단값 문제를 해결한다. 한계점으로는 (1) SPN 구조 학습이 대규모 고차원 데이터에서 여전히 계산 비용이 높을 수 있다는 점, (2) 다중 보호 속성(교차성) 상황에서 독립 변수 선정이 복잡해질 가능성, (3) 백분위 동등성 정의가 연속형 변수에 자연스럽게 적용되지만, 범주형 변수에 대한 확장 방법이 아직 미비하다는 점을 들 수 있다. 저자들은 향후 연구에서 PSDD와 같은 다른 트랙터블 모델과의 비교, 다중 보호 속성에 대한 확장, 그리고 실시간 시스템에의 적용 가능성을 탐색할 계획이라고 제시한다. 결론적으로, 이 논문은 트랙터블 확률 모델을 활용해 보호 속성과 다른 변수 간의 복잡한 의존성을 효율적으로 탐지하고, 이를 기반으로 사전 처리와 백분위 기반 보정을 수행함으로써 기존 공정성 기법이 갖는 한계를 극복한다는 점에서 의미가 크다.

트랙터블 모델을 활용한 머신러닝 공정성 연구

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기