방사선 보고서 언어 모델링을 위한 BiLSTM 활용
본 연구는 흉부 X‑ray 보고서에 대한 의료 개체명 인식(NER)과 부정 검출을 위해 양방향 LSTM(BiLSTM) 모델을 설계하고, 사전 학습된 여러 종류의 워드 임베딩(GloVe, 의료 온톨로지를 활용한 변형 GloVe)과 결합하여 기존 사전 기반 및 규칙 기반 시스템과 성능을 비교한다. 실험 결과 BiLSTM이 높은 재현율과 정밀도를 보이며 전통적 방법을 대체할 수 있음을 확인하였다.
저자: Savelie Cornegruta, Robert Bakewell, Samuel Withey
본 논문은 방사선 보고서에서 자동으로 임상 정보를 추출하기 위한 두 가지 핵심 NLP 작업, 즉 의료 개체명 인식(NER)과 부정(negation) 검출을 대상으로 최신 딥러닝 모델인 양방향 LSTM(BiLSTM)을 적용한다. 연구 배경으로는 방사선 보고서가 전자 의료 기록(EMR)에서 차지하는 비중이 크고, 보고서가 비정형 텍스트, 맞춤법 오류, 음성 인식 오류 등으로 인해 전통적인 규칙 기반 방법으로는 한계가 있다는 점을 들었다.
데이터는 영국 NHS 소속 두 병원에서 수집한 745,480개의 흉부 X‑ray 보고서이며, 이 중 2,000개를 무작위 추출해 전문가 두 명이 직접 4개의 의미 그룹(Clinical Finding, Body Location, Descriptor, Medical Device)과 부정 속성을 라벨링하였다. 라벨링은 IOBES 스키마로 변환돼 모델 입력으로 사용된다. 전체 어휘는 전처리 후 8,031개의 토큰으로 구성되었다.
모델 설계는 다음과 같다. 입력 문장은 토큰 인덱스로 변환돼 임베딩 층을 통과해 저차원 벡터 시퀀스로 매핑된다. 임베딩은 (1) 공개된 GloVe, (2) 동일 코퍼스에서 자체 학습한 임베딩, (3) RadLex와 같은 방사선 전용 온톨로지를 활용해 의미 정보를 강화한 변형 GloVe 세 종류를 실험한다. 이후 BiLSTM 레이어가 순방향·역방향 두 방향으로 문맥을 캡처하고, 각 타임스텝의 은닉 상태를 연결해 최종 은닉 벡터를 만든다. 이 벡터는 전결합(fully‑connected) 레이어와 소프트맥스 함수를 거쳐 5개의 클래스(4개의 의미 그룹 + 부정) 중 하나를 예측한다. 학습 과정에서는 그래디언트 클리핑, Adam 옵티마이저, dropout 등을 적용해 과적합을 방지한다.
베이스라인으로는 (1) 사전 기반 딕셔너리 매칭을 이용한 NER 시스템, (2) NegEx 규칙과 Stanford Dependency Parser를 결합한 부정 검출 시스템을 사용한다. 딕셔너리 시스템은 높은 정밀도(>0.9)를 보이나 재현율이 낮아 실제 임상 적용에 제약이 있다. NegEx 기반 부정 검출은 간단하고 빠르지만, 고정된 윈도우 방식으로 인해 다중 개체가 존재할 때 거짓 양성이 많이 발생한다.
실험 결과, BiLSTM 모델은 전체 F1 점수에서 딕셔너리 기반 NER을 7~9%p 상회했으며, 부정 검출에서도 규칙 기반 대비 4~6%p 향상된 성능을 보였다. 특히 복합 어구(예: “mildly hyper expanded lungs”)와 비정형 표현을 정확히 인식하는 데 강점을 나타냈다. 임베딩 종류별 비교에서는 의료 온톨로지를 포함한 변형 GloVe가 가장 높은 F1(≈0.92)를 기록했으며, 일반 GloVe와 자체 학습 임베딩도 비슷한 수준을 유지했다. 이는 도메인 특화 의미 정보가 모델 성능에 긍정적인 영향을 미친다는 것을 의미한다.
또한, 라벨링 데이터가 제한적인 상황에서도 사전 학습된 임베딩을 활용함으로써 충분한 일반화 능력을 확보할 수 있음을 확인했다. 이는 의료 현장에서 라벨링 비용을 최소화하면서도 높은 정확도의 정보 추출 시스템을 구축할 수 있는 실용적인 방안을 제시한다.
결론적으로, 본 연구는 방사선 보고서와 같은 특수 의료 텍스트에 대해 BiLSTM 기반 모델이 전통적인 규칙·사전 기반 방법을 뛰어넘는 성능을 보이며, 다양한 임베딩 전략과 결합해 도메인 특화 정보를 효과적으로 활용할 수 있음을 입증한다. 향후 연구에서는 더 큰 규모의 다기관 코퍼스와 다중 언어 확장을 통해 모델의 범용성을 검증하고, 추출된 구조화 데이터의 임상 의사결정 지원 시스템 적용 가능성을 탐색할 예정이다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기