의료 진단을 위한 신경망 규칙 추출 기법

초록

본 논문은 백프로파게이션 신경망으로 학습된 모델에서 인간이 이해할 수 있는 상징적 규칙을 자동으로 추출하는 알고리즘을 제안한다. 유방암, 당뇨병, 렌즈 데이터셋을 대상으로 실험을 수행했으며, 추출된 규칙은 규칙 수, 평균 조건 수, 예측 정확도 측면에서 기존 방법들과 경쟁력을 보였다.

상세 요약

본 연구는 신경망이 높은 분류 성능을 보이지만 해석이 어려운 ‘블랙 박스’ 문제를 해결하고자, 학습된 가중치를 기반으로 명시적 규칙을 도출하는 절차를 설계하였다. 핵심 아이디어는 은닉층의 활성화 패턴을 이산화하여 각 뉴런이 특정 입력 구간에서 활성화되는지를 판단하고, 이를 논리식 형태로 변환하는 것이다. 이를 위해 먼저 학습된 네트워크에 대해 각 입력 샘플에 대한 은닉층 출력값을 수집하고, 출력값을 임계값 기반으로 0‑1 이진값으로 양자화한다. 그 다음, 이진화된 은닉 뉴런들을 ‘조건’으로 간주하고, 출력 클래스와의 상관관계를 분석하여 ‘if‑then’ 형태의 규칙을 구성한다. 규칙 생성 단계에서는 불필요한 조건을 제거하고, 동일한 결론을 내는 규칙들을 병합하는 최소화 과정을 적용한다.

실험에서는 UCI 저장소의 유방암(특징 30개, 2 클래스), 당뇨병(특징 8개, 2 클래스), 렌즈(특징 4개, 3 클래스) 데이터를 사용하였다. 각 데이터셋에 대해 다층 퍼셉트론을 표준 백프로파게이션으로 학습시킨 뒤, 제안된 규칙 추출 알고리즘을 적용하였다. 결과는 세 가지 주요 지표—규칙 수, 평균 조건 수, 그리고 테스트 정확도—에서 기존 결정 트리 기반 방법(C4.5, RIPPER 등)과 비교되었다. 특히 유방암 데이터에서는 5개의 규칙으로 평균 3.2개의 조건을 갖는 모델이 96.5%의 정확도를 달성했으며, 이는 원본 신경망(97.2%)과 거의 차이가 없었다. 당뇨병 데이터에서도 7개의 규칙이 78% 수준의 정확도를 유지했으며, 이는 기존 방법보다 규칙 수가 적음에도 불구하고 경쟁력 있는 성능을 보여준다.

알고리즘의 장점은 (1) 신경망이 학습한 복잡한 비선형 관계를 유지하면서도 인간이 직관적으로 이해할 수 있는 형태로 변환한다는 점, (2) 규칙 수와 조건 수를 조절할 수 있는 파라미터를 제공하여 모델 복잡도와 해석 가능성 사이의 트레이드오프를 조정한다는 점이다. 반면 한계점으로는 (가) 은닉층의 뉴런 수가 많을 경우 이진화 과정에서 발생하는 조합 폭이 급격히 증가해 규칙 최소화 비용이 크게 늘어난다, (나) 연속형 입력 특성에 대한 임계값 선택이 결과 규칙의 품질에 민감하게 작용한다는 점을 들 수 있다. 향후 연구에서는 차원 축소 기법과 베이지안 최적화 기반 임계값 탐색을 결합하여 대규모 네트워크에서도 효율적인 규칙 추출을 목표로 할 수 있다.

초록

상세 요약

📜 논문 원문 (영문)