PCOS 진단을 위한 지식그래프 기반 다중 에이전트 프레임워크 Mapis

PCOS 진단을 위한 지식그래프 기반 다중 에이전트 프레임워크 Mapis
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

Mapis는 2023년 국제 PCOS 진단 가이드라인을 구조화한 워크플로우와 PCOS 전용 지식그래프를 결합한 최초의 다중 에이전트 시스템이다. 데이터 전처리, 지식그래프 구축, 3단계 포함 기준 평가, 배제 단계, 보고서 생성의 5개 모듈로 구성되며, 부인증(gynecological‑endocrine) 에이전트, 영상학(radiology) 에이전트, 배제(exclusion) 에이전트, 코디네이터, 보고서 에이전트가 협업한다. 공개 벤치마크와 자체 임상 데이터셋에서 9개 베이스라인을 넘어 정확도 13.56%p(전통 ML), 6.55%p(단일 LLM), 7.05%p(기존 의료 다중 에이전트) 향상을 달성했다.

상세 분석

Mapis의 핵심 설계는 “가이드라인‑구동형” 진단 흐름을 에이전트 간 명시적 역할 분담으로 구현한 점이다. 먼저 원시 전자건강기록(EHR)을 LLM 기반 전처리 모듈이 JSON 형태의 구조화 데이터로 변환한다. 이때 텍스트 정규화, 단위 통일, 누락값 보완 등을 자동화해 downstream 모듈의 입력 일관성을 확보한다.

다음 단계는 PCOS 전용 지식그래프(KG) 구축이다. 저자들은 국제 가이드라인과 최신 논문을 “semantic chunking → entity‑relation extraction → triple merging” 파이프라인으로 처리해 3‑hop 트리플을 생성한다. KG는 ‘증상‑검사‑진단기준’, ‘배제 질환‑관련 검사’, ‘치료‑생활습관’ 등 도메인 별 서브그래프를 포함하며, UMLS 및 SNOMED CT와 연계해 표준화된 개념 ID를 부여한다. 이는 LLM의 hallucination을 억제하고, 에이전트가 질의 시 정확한 근거를 검색하도록 만든다.

진단 실행은 세 단계로 나뉜다. (1) 부인증 에이전트는 불규칙 월경과 임상적 고안드로겐증을 확인하고, 필요 시 혈청 호르몬 수치를 검증한다. (2) 위 두 기준 중 하나만 충족될 경우, 방사학 에이전트가 초음파 영상을 기반으로 다낭성 난소 형태(PCOM)를 평가한다. (3) 두 개 이상의 기준이 만족되면 ‘포함 기준 충족’으로 판단한다. 이 흐름은 코디네이터 에이전트가 상태 머신 형태로 관리하며, 각 단계의 성공/실패 신호에 따라 다음 에이전트 호출을 결정한다.

배제 단계에서는 배제 에이전트가 ‘다른 원인 배제’를 전담한다. KG에 저장된 CAH, 갑상선 질환, 고프로락틴혈증 등과 연관된 임상·검사 항목을 교차 검증해, 해당 질환이 존재하면 최종 진단을 ‘배제’로 전환한다. 배제 로직은 규칙 기반과 KG‑driven 추론을 혼합해, 복합 증상에서도 높은 특이성을 유지한다.

마지막으로 보고서 에이전트는 모든 판단 근거를 KG와 연계해 인간 친화적인 임상 보고서를 자동 생성한다. 보고서는 포함 기준, 배제 결과, 권고 생활습관 및 추후 검사 계획을 포함해, 의사가 바로 검토·수정할 수 있는 형태로 제공된다.

성능 평가에서는 공개된 PCOS 데이터셋(임상 기록·초음파 이미지)과 자체 수집한 1,200건 임상 데이터에 대해 9개 베이스라인(전통 ML, 단일 LLM, 기존 다중 에이전트 등)과 비교했다. 정확도 외에도 정밀도·재현율·F1 점수에서 모두 유의미한 개선을 보였으며, 특히 배제 단계에서의 오탐률 감소가 전체 성능 향상의 주요 요인으로 분석된다. 또한, 에이전트 간 인터랙션 로그와 KG 질의 기록을 통해 모델의 추론 과정을 투명하게 추적할 수 있어, 임상 현장에서 요구되는 ‘설명 가능성’도 충족한다.

한계점으로는 KG 구축에 필요한 도메인 전문가 작업량, EHR 데이터의 품질 편차, 그리고 현재는 PCOS에 특화된 설계이므로 다른 질환에 적용하려면 가이드라인 재구성 및 KG 재구축이 필요하다는 점을 들 수 있다. 향후 연구에서는 자동화된 KG 업데이트 파이프라인, 멀티모달(이미지·텍스트) 통합, 그리고 다른 내분비 질환으로의 확장 가능성을 탐색할 예정이다.


댓글 및 학술 토론

Loading comments...

의견 남기기