히스토아틀라스 전암종 형태학 지도

히스토아틀라스는 21개 TCGA 암종의 6,745개 진단 H&E 슬라이드에서 38개의 해석 가능한 히스토믹 특징을 추출하고, 이를 생존, 유전자 발현, 돌연변이, 면역 아형과 연계한다. 모든 연관성은 공변량 보정·다중 검정 보정 후 증거 강도 단계로 분류되며, 조직 구획 및 개별 세포 수준에서 시각화 가능하다. 이 자원은 기존 생물학을 재현하고 새로운 조직특이 면역 신호와 형태학적 아형을 발견한다.

저자: Pierre-Antoine Bannier

히스토아틀라스 전암종 형태학 지도
히스토아틀라스는 TCGA 프로젝트에 포함된 21개의 고형암 종에서 수집된 6,745개의 진단용 H&E 슬라이드를 대상으로, 자동화된 이미지 분석 파이프라인을 구축하여 38개의 해석 가능한 히스토믹 특징을 추출한 전암종 규모의 형태학 데이터베이스이다. 연구는 먼저 UNet 기반 조직 구획 모델을 이용해 슬라이드를 종양, 기질, 괴사, 혈관, 정상 상피 5가지 구획으로 분할하고, 이어서 HistoPLUS 셀 검출·분류 모델을 통해 9가지 세포 유형을 44억 개 이상 식별하였다. 이 과정을 통해 얻은 정량적 지표는 조직 구성 비율, 세포 밀도, 핵 형태·동역학, 공간 조직화, 이질성 등 다섯 범주로 정리되었다. 각 특징에 대해 생존 연관성, 유전자 발현, 복제수 변이, 주요 암 유전자 변이, Hallmark 경로 점수, 면역 세포 비율 등 293개의 분자 타깃과의 연관성을 체계적으로 검증하였다. 생존 분석은 Cox 비례위험 모델을 사용해 전체생존, 질병특이생존, 무병생존, 진행생존 네 가지 엔드포인트에 대해 22개 코호트(21개 암종+전체)별로 수행했으며, 연령·성별·병기·샘플 출처를 보정하였다. 다중 검정은 사전 정의된 보정 패밀리 내에서 Benjamini–Hochberg FDR 0.05를 적용했으며, 최종적으로 260개의 유의한 생존 연관성이 도출되었다. 모든 연관성은 비례위험 가정 검증을 통과했으며, 필요 시 RMST(제한 평균 생존시간) 보조 지표도 제공하였다. 분자 연관성 분석에서는 38개 히스토믹 특징과 293개 분자 타깃 사이의 Spearman 상관을 계산하였다. 공변량 보정 후 FDR 0.05 기준 88,920개의 유의한 상관이 발견되었으며, 면역 세포 비율(39.2%), Hallmark 경로(30.4%), 유전자 발현(24.9%)에서 높은 검출률을 보였다. 특히, 종양 내 림프구 밀도는 전암종 수준에서 HR 0.87(95% CI 0.81‑0.93)로 강한 보호 효과를 나타냈으며, 종양과 기질 구획을 구분한 면역 지표가 기존의 전체 TIL 점수보다 예후 예측에 더 민감함을 입증했다. 또한, 종양-림프구 근접 거리와 CD8A 발현 간의 역상관(ρ = –0.53) 등 공간 토포그래피와 전사체 수준 면역 마커 간의 일관된 연관성이 확인되었다. 형태학적 클러스터링은 UMAP 차원 축소와 K‑means 군집화를 통해 10개의 L1 전암종 클러스터와 69개의 L2 암종별 서브클러스터를 도출하였다. 클러스터는 조직학적 유사성에 따라 자연스럽게 형성되었으며, 전혀 분자 정보를 사용하지 않았음에도 불구하고 Wnt/β‑catenin 활성, 에스트로겐 반응, 저산소증, 인터페론‑γ 반응 등 알려진 분자 경로와 강하게 연관되었다. 예를 들어, L4 클러스터는 흉선 조직에 특이한 면역 거부 경로를, L6 클러스터는 대장암에서 흔히 관찰되는 Wnt 활성 및 C1 상처 치유 면역 아형을, L8 클러스터는 유방·전립선 암에서 에스트로겐 반응과 증식 억제를 보였다. 이러한 클러스터는 암 유형을 넘어 형태학적 이질성을 포착하며, 동일 암종 내에서도 면역 아형(C2)이나 호르몬 반응 차이에 따라 서브클러스터가 구분되는 등 임상·분자적 의미를 지닌다. 히스토아틀라스는 데이터와 분석 파이프라인을 모두 공개 웹 인터페이스(https://histoatlas.com)로 제공한다. 사용자는 특정 히스토믹 특징을 선택해 해당 특징이 어느 조직 구획·세포에 기여하는지 시각적으로 확인할 수 있으며, 연관된 생존·분자·면역 결과를 즉시 조회할 수 있다. 전체 파이프라인은 공개 코드와 Docker 이미지로 배포돼 재현성을 보장한다. 이 자원은 기존의 cBioPortal·TCIA·Human Protein Atlas와 달리 형태학과 분자 데이터를 직접 연결함으로써, 연구자들이 H&E 슬라이드만으로도 대규모 바이오마커 탐색과 임상 예후 모델링을 수행할 수 있게 한다. 향후에는 추가 암종 및 비암성 조직을 포함하고, 더 정교한 딥러닝 기반 특징 추출과 멀티오믹스 통합을 확대할 계획이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기