일반 조직병리 슬라이드만으로 판별하는 췌장암 분자 아형 딥러닝 모델

일반 조직병리 슬라이드만으로 판별하는 췌장암 분자 아형 딥러닝 모델
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

PanSubNet은 H&E 염색 전통 슬라이드에서 PDAC의 basal‑like와 classical 아형을 예측하는 이중 스케일 딥러닝 프레임워크이다. 1,055명의 환자(다기관 PANCAN 778명, TCGA 209명) 데이터를 이용해 Moffitt 50‑gene 서명을 기반으로 라벨링하고, 세포‑레벨과 조직‑레벨 특징을 attention 융합으로 학습한다. 내부 교차검증에서 평균 AUC 90.3%, 외부 TCGA 검증에서 AUC 84.0%를 기록했으며, 전이환에서도 전사체 기반 라벨보다 생존 구분력이 뛰어났다. 모델은 예측 불확실성을 통해 중간 전사체 상태를 식별하고, DNA 손상 복구·분화 마커와 연관된 생물학적 해석을 제공한다.

상세 분석

본 연구는 췌장관암(PDAC)의 임상적 의사결정에 핵심적인 전사체 기반 아형( basal‑like vs. classical)을 조직병리학적 이미지만으로 추론하는 새로운 딥러닝 파이프라인을 제시한다. 라벨링은 Moffitt 50‑gene 서명에 GATA6 발현을 추가해 고신뢰도( |z|>1) 샘플만을 선택함으로써 전사체 라벨의 잡음을 최소화하였다. 모델 아키텍처는 두 가지 스케일을 병행한다. 첫 번째 스케일은 CellVIT++를 이용해 세포 단위의 형태·핵·세포질 색상 특징을 추출하고, 이웃 세포와의 공간 관계를 그래프 형태로 인코딩한다. 두 번째 스케일은 UNI2‑h 백본을 사용해 256×256 µm 패치 수준의 조직 구조를 학습한다. 두 스케일의 임베딩은 멀티‑헤드 어텐션 모듈을 통해 가중치를 동적으로 할당받아 슬라이드‑레벨 표현으로 통합된다. 이렇게 얻어진 통합 임베딩은 최종적으로 이진 분류 헤드에 입력되어 아형 확률을 출력한다.

성능 평가는 내부 5‑fold 교차검증과 외부 TCGA 코호트(미세조정 없이) 두 단계로 진행되었다. 내부 검증에서는 평균 AUC 90.3%와 정확도 87.0%를 달성했으며, 민감도와 특이도가 각각 86.8%와 87.6%로 균형을 이루었다. 특히 고신뢰도 샘플에서 모델의 결정 마진이 크게 나타나, 오분류는 주로 예측 확신이 낮은 경우에 국한됨을 확인했다. 외부 검증에서는 AUC 84.0%, 정확도 76.0%를 기록, 데이터 수집·슬라이드 스캐닝·염색 프로토콜 차이를 넘어선 일반화 능력을 입증하였다.

또한, 모델을 전체 PANCAN 코호트(고신뢰도·저신뢰도 포함)에 적용했을 때 AUC가 71.3%로 감소했지만, 이는 전사체 스코어가 연속적인 스펙트럼을 형성한다는 점을 반영한다. 저신뢰도·중간형 샘플을 별도로 분류하도록 추가 레이어를 fine‑tune한 결과 AUC 74.9%를 얻어, PanSubNet이 아형 확신도와 연관된 미세한 조직학적 신호를 포착함을 시사한다.

생존 분석에서는 전이환 환자를 대상으로 RNA‑seq 라벨과 PanSubNet 예측 라벨을 각각 사용해 Kaplan‑Meier 곡선을 그렸다. RNA‑seq 라벨은 통계적 유의미성(p=0.08)에 그쳤으나, PanSubNet 라벨은 p<0.05 수준으로 명확한 생존 차이를 보였다. 특히 RNA‑seq에서 classical으로 분류됐지만 모델이 basal‑like으로 예측한 환자군은 조기 사망 비율이 현저히 높아, 조직학적 이미지가 전사체 라벨보다 임상적 위험을 더 잘 포착할 수 있음을 보여준다.

해석 가능성 측면에서, 어텐션 가중치 시각화는 basal‑like 종양에서 핵밀도 증가·섬유성 기질 확대, classical 종양에서는 선상 구조와 분화된 선상 세포 군집이 강조되는 패턴을 드러냈다. 또한, 모델 출력과 DNA 손상 복구(DDR) 유전자 발현, KRAS 변이 부하, 그리고 미세환경 관련 경로(예: EMT, 염증 반응)와의 상관관계를 분석해, 이미지 기반 예측이 알려진 분자 메커니즘과 일관됨을 검증하였다.

마지막으로, PanSubNet은 기존 AttMIL(UN I2‑h 기반)과 비교했을 때 외부 TCGA에서 특이도 저하가 현저히 적으며, 전반적인 성능 안정성이 뛰어나다. 이는 이중 스케일 설계와 어텐션 융합이 조직학적 다중 스케일 정보를 효과적으로 통합했기 때문으로 해석된다. 전반적으로 PanSubNet은 비용·시간·시료 요구량이 제한적인 전사체 분석을 대체하거나 보완할 수 있는 실용적인 디지털 병리 솔루션으로, 향후 임상 워크플로우에 통합될 가능성이 높다.


댓글 및 학술 토론

Loading comments...

의견 남기기