AbFlow: 흐름 매칭 기반 파라토프 중심 항체 설계
초록
AbFlow는 최적 수송 이론에 기반한 흐름 매칭 프레임워크와 항원 표면 정보를 활용한 다채널 인코더(SME)를 결합해, CDR‑H3(파라토프) 영역을 중심으로 전체 원자 수준의 항체 구조와 서열을 엔드‑투‑엔드로 생성한다. 파라토프 전용 흐름을 제한적으로 학습하면서 전역 구조에 정보를 전파하고, 항원 표면의 기하·화학 특성을 주입해 인터페이스 정확도를 크게 향상시킨다. 실험에서 기존 단계별·엔드‑투‑엔드 모델 대비 접촉면 RMSD와 결합 친화도에서 현저히 우수한 성능을 보였다.
상세 분석
AbFlow는 항체 설계의 핵심 난제인 파라토프(특히 CDR‑H3)와 전역 프레임워크 간의 구조적 연계를 흐름 매칭(flow matching)이라는 연속 정규화 흐름(CNF) 기반 최적 수송 기법으로 해결한다. 기존의 전체 항체에 CNF를 적용하면 차원 폭이 커져 계산 비용이 급증하므로, 저자는 파라토프 영역만을 흐름의 목표 분포로 설정하고, 이 지역에 대한 시간‑의존 속도장 u(x,t)를 EGNN(Equivariant Graph Neural Network) 기반의 확장된 속도장 네트워크가 예측하도록 설계하였다. 이 네트워크는 두 가지 역할을 수행한다. 첫째, 파라토프 원자 좌표를 Gaussian 노이즈에서 실제 구조로 매핑하는 연속 흐름을 학습해 샘플링 단계에서 ODE 적분만으로 고품질 파라토프를 생성한다. 둘째, 파라토프에서 전신 항체(framework)로 구조 정보를 전파하는 메시징 메커니즘을 제공한다.
항원 특이성을 반영하기 위해 도입된 Surface Multi‑channel Encoder(SME)는 항원 표면을 다중 채널(예: 거리, 법선, 전하, 친수성 등)으로 표현하고, E(3)‑equivariant 그래프 컨볼루션을 통해 고차원 특징을 추출한다. 추출된 특징은 속도장 네트워크의 입력에 결합되어, 파라토프 생성 시 항원‑항체 인터페이스의 기하학적 일치를 강화한다. 이는 기존 모델이 전역 구조는 잘 생성하지만 인터페이스 세부 정보를 놓치는 문제를 효과적으로 보완한다.
학습 손실은 조건부 흐름 매칭 손실 L_F와 정규화 항을 포함한다. L_F는 시간 t에 대한 샘플 x_t와 목표 파라토프 x_1 사이의 실제 속도장과 예측 속도장 간 L2 차이를 최소화한다. 또한, 샘플 쌍을 사전 정렬(pre‑align)하기 위해 Kabsch 알고리즘(회전·이동)과 Hungarian 알고리즘(순열)을 사용해 구조적 교차를 방지한다. 이러한 설계는 흐름 경로가 선형 보간을 따르면서도, 항원 표면 정보에 의해 변형되는 비선형성을 학습하도록 만든다.
실험에서는 파라토프‑중심 설계, 다중 CDR 설계, 전체 원자 구조 설계, 결합 친화도 최적화, 복합체 구조 예측 등 다섯 가지 벤치마크를 수행했다. AbFlow는 RMSD, DockQ, 인터페이스 면적, ΔΔG 등 다양한 지표에서 기존 최첨단 모델(예: dyMEAN, IgFlow, HERN, Di∂Ab 등)을 크게 앞섰으며, 특히 파라토프‑항원 접촉면에서 15 %~25 % 정도의 정확도 향상을 기록했다. Ablation study에서는 SME를 제거했을 때 인터페이스 RMSD가 평균 0.4 Å 상승하고, 파라토프‑전역 흐름 제한을 풀면 전역 구조 일관성이 크게 감소함을 확인했다.
한계점으로는 현재 파라토프를 CDR‑H3에만 국한하고 있어, 다른 CDR(예: CDR‑L1 등)와 프레임워크 변이까지 동시에 최적화하는 확장성이 부족하다. 또한, 속도장 네트워크가 EGNN에 크게 의존하므로, 대규모 데이터셋에서의 학습 안정성 및 메모리 사용량이 여전히 도전 과제로 남는다. 향후 연구에서는 다중 파라토프 영역을 동시에 다루는 다중 흐름 매칭, 더 정교한 항원 표면 물리‑화학 모델링, 그리고 실험적 검증을 위한 in‑vitro/인‑실리코 파이프라인 통합이 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기