온톨로지 기반 암 치료 의사결정 지원 시스템 설계와 사례 기반 추론
초록
본 논문은 암의 임상 단계와 관련 정보를 구조화한 Disease Ontology를 활용해, 사례 기반 추론(CBR)과 자연어 처리(NLP) 질의 응답을 결합한 의사결정 지원 시스템(DSS)을 제안한다. 온톨로지 기반 지식 모델링으로 질병 분류 정확도를 84.63%까지 향상시켰으며, 유사 사례 검색을 통해 치료 옵션을 제시한다.
상세 분석
이 연구는 의료 정보학에서 온톨로지와 사례 기반 추론을 통합한 하이브리드 DSS 구축이라는 새로운 접근을 시도한다. 먼저, Disease Ontology(DO)를 암의 임상 단계, 병리학적 특징, 치료 옵션 등으로 확장하여 개념 간 계층적 관계와 속성을 명시적으로 정의한다. 이러한 온톨로지는 RDF/OWL 형식으로 구현돼, SPARQL 질의로 빠른 의미 검색이 가능하도록 설계되었다.
시스템의 핵심 모듈은 세 가지로 구분된다. 1) NLP 전처리 및 의미 매핑: 사용자가 입력한 자연어 진단·증상 서술을 토큰화, 형태소 분석 후, 사전 정의된 온톨로지 용어와 매핑한다. 여기서 개체명 인식(NER)과 관계 추출을 위해 기존의 의료용 BERT 모델을 fine‑tuning 하여, 용어 동의어와 약어를 효과적으로 처리한다. 2) 사례 기반 추론(CBR) 엔진: 온톨로지 기반 특징 벡터를 이용해 기존 케이스 데이터베이스와 유사도(코사인, Jaccard 등)를 계산한다. 유사도 상위 N개의 사례를 선택하고, 각 사례에 포함된 치료 프로토콜·예후 데이터를 가중 평균해 추천 치료 옵션을 도출한다. 3) 피드백 루프: 의사가 최종 결정을 내리면 그 결과를 시스템에 기록하고, 온톨로지와 사례 저장소를 자동 업데이트한다. 이를 통해 지속적인 학습과 정확도 향상이 가능하다.
실험에서는 1,200건의 암 환자 기록을 기반으로 10‑fold 교차 검증을 수행했으며, 온톨로지 없이 전통적인 텍스트 기반 분류 모델과 비교했을 때 정확도가 84.63%로 7.2%p 상승하였다. 특히, 진행 단계가 복합적인 경우(예: 전이성·재발 암) 온톨로지의 계층 구조가 의미적 차이를 명확히 구분해 주어, 오분류율이 크게 감소하였다.
하지만 몇 가지 한계점도 존재한다. 첫째, 온톨지 구축에 필요한 도메인 전문가의 작업량이 크며, 최신 치료 가이드라인 반영에 시간이 소요된다. 둘째, CBR은 사례 데이터베이스가 충분히 풍부하지 않을 경우 추천 품질이 저하될 위험이 있다. 셋째, 현재 시스템은 영어·한국어 이중 언어 지원에 제한적이며, 다국어 의료 텍스트에 대한 일반화가 필요하다. 향후 연구에서는 자동 온톨로지 확장을 위한 머신러닝 기반 관계 추출, 대규모 다기관 사례 수집, 그리고 강화학습을 통한 치료 옵션 최적화 등을 제안한다.
댓글 및 학술 토론
Loading comments...
의견 남기기