대형 언어 모델과 답변 집합 프로그래밍을 활용한 설명 가능한 질병 진단 프레임워크

초록

정확한 질병 예측은 시기 적절한 개입, 효과적인 치료 및 의료 합병증 감소에 필수적이다. 기존에 상징적 인공지능이 의료 분야에 적용된 사례가 있으나, 고품질 지식 베이스 구축에 드는 막대한 노력 때문에 채택이 제한되어 왔다. 본 연구는 대형 언어 모델(LLM)과 답변 집합 프로그래밍(ASP)을 결합한 프레임워크인 McCoy를 제안한다. McCoy는 LLM을 활용해 의료 문헌을 ASP 코드로 자동 변환하고, 이를 환자 데이터와 결합한 뒤 ASP 솔버를 통해 최종 진단을 도출한다. 이와 같은 통합은 두 패러다임의 장점을 살려 해석 가능하고 견고한 예측 체계를 제공한다. 예비 실험 결과, McCoy는 소규모 질병 진단 과제에서 강력한 성능을 보였다.

상세 요약

본 논문은 인공지능 기반 의료 진단 시스템에서 가장 오래된 난제 중 하나인 ‘지식 획득 비용’ 문제를 혁신적으로 해결하려는 시도로 평가할 수 있다. 전통적인 상징적 AI, 특히 답변 집합 프로그래밍(ASP)은 논리적 추론과 설명 가능성 측면에서 뛰어나지만, 도메인 전문가가 직접 규칙을 작성해야 하는 부담이 크다. 반면 최근 급부상한 대형 언어 모델(LLM)은 방대한 텍스트 코퍼스를 학습해 자연어를 코드 형태로 변환하는 능력을 보이며, 비전문가도 비교적 손쉽게 지식을 추출할 수 있다. McCoy는 이 두 기술을 ‘오케스트레이션’이라는 메커니즘으로 연결한다. 구체적으로, LLM에게 최신 의학 논문·가이드라인을 입력으로 제공하면, 모델은 해당 내용을 논리식(ASP 규칙)으로 변환한다. 여기서 중요한 점은 변환 과정이 완전 자동화된 것이 아니라, 프롬프트 설계와 후처리 단계에서 인간 전문가가 검증·수정함으로써 오류를 최소화한다는 점이다. 이렇게 생성된 ASP 규칙은 환자 메타데이터(증상, 검사 결과 등)와 결합되어 ASP 솔버에 투입된다. 솔버는 규칙 집합과 사실을 기반으로 일관된 모델(답변 집합)을 탐색하고, 그 중 최적의 진단을 선택한다.

이 접근법의 장점은 다음과 같다. 첫째, 지식 베이스 구축 비용이 크게 감소한다. 기존에는 의료 전문가가 직접 논리 규칙을 코딩해야 했지만, LLM이 초안을 제공함으로써 작업량이 70 % 이상 절감될 가능성이 있다. 둘째, 결과의 설명 가능성이 유지된다. ASP는 추론 과정이 명시적이므로, 최종 진단이 어떤 규칙에 의해 도출됐는지 쉽게 추적할 수 있다. 이는 ‘블랙박스’ 딥러닝 모델에 비해 임상 현장에서 신뢰성을 크게 높인다. 셋째, 시스템이 모듈식이다. 새로운 질병이나 최신 가이드라인이 발표되면 해당 문헌만 LLM에 재투입하면 되고, 기존 ASP 규칙은 그대로 재사용 가능하다.

하지만 한계점도 명확히 존재한다. LLM이 생성하는 ASP 코드는 아직 완전한 형식적 정확성을 보장하지 못한다. 특히 복잡한 의료 용어의 다의성이나 문맥 의존성이 높은 경우, 잘못된 전제(예: 부정 논리의 누락)가 삽입될 위험이 있다. 따라서 인간 전문가의 검증 단계가 필수적이며, 이 과정이 자동화 수준을 제한한다. 또한 현재 실험은 ‘소규모 질병 진단 과제’에 국한되어 있어, 다중 질환·다중 증상·대규모 환자군에 대한 확장성은 검증되지 않았다. ASP 솔버 자체도 문제 규모가 커지면 계산 복잡도가 급증하는 NP‑hard 특성을 가지므로, 실시간 임상 지원에 적용하려면 효율적인 근사 알고리즘이나 하드웨어 가속이 필요하다.

향후 연구 방향으로는 (1) LLM‑ASP 변환의 형식 검증 자동화, (2) 대규모 임상 데이터셋을 활용한 성능 및 일반화 평가, (3) 인터랙티브 UI를 통한 전문가‑AI 협업 워크플로우 설계, (4) 하이브리드 추론 엔진(예: ASP와 확률 그래프 모델 결합) 구축을 제안한다. 이러한 발전이 이루어진다면, McCoy와 같은 프레임워크는 ‘설명 가능한 AI’가 실제 의료 현장에 스며들어 진단 정확도와 투명성을 동시에 향상시키는 핵심 인프라가 될 전망이다.

초록

상세 요약

📜 논문 원문 (영문)