비대칭 약물 상호작용 예측을 위한 다중모달 그래프 콜모고로프‑아놀드 네트워크

비대칭 약물 상호작용 예측을 위한 다중모달 그래프 콜모고로프‑아놀드 네트워크
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

MGKAN은 비대칭 DDI를 예측하기 위해 세 가지 네트워크(비대칭 DDI, 공동 상호작용, 생화학적 유사성)를 구축하고, 각 뷰에 KAN 기반 메시지 패싱을 적용한다. 선형 어텐션과 KAN 기반 비선형 융합을 결합해 역할‑특정 임베딩을 생성하고, 양방향 바이리니어 디코더로 최종 상호작용 확률을 추정한다. 두 개의 DrugBank 기반 벤치마크에서 기존 7개 모델을 모두 능가했으며, Ablation 및 사례 연구를 통해 비대칭성 캡처와 다중모달 통합의 효과를 입증한다.

상세 분석

본 논문은 기존 그래프 신경망(GNN)이 주로 대칭적인 관계를 가정하고, 선형 집계에 의존한다는 한계를 지적한다. 비대칭 DDI는 소스 약물이 타깃 약물의 대사·효능에 미치는 영향이 방향성을 가지며, 이는 임상에서 약물 투여 순서와 용량 조절에 핵심적인 정보이다. MGKAN은 이러한 비대칭성을 모델링하기 위해 세 가지 핵심 설계를 도입한다.

첫째, 다중모달 네트워크 뷰를 구성한다. 비대칭 DDI 네트워크는 직접적인 방향성 에지를 제공하고, 공동 상호작용(co‑interaction) 네트워크는 두 약물이 동일한 제3 약물과 상호작용하는 경우를 통해 2차 연결성을 보강한다. 생화학적 유사성 네트워크는 타깃, 효소, 운반체 정보를 Jaccard 유사도로 변환해 약물 간 기능적 유사성을 정량화한다. 이 세 뷰는 각각 구조적, 토폴로지적, 생물학적 정보를 제공해 단일 그래프만을 이용한 모델이 놓치기 쉬운 고차 상호작용을 포착한다.

둘째, Graph Kolmogorov‑Arnold Network (GKAN) 를 도입한다. 기존 GNN의 MLP 변환을 KAN(Kolmogorov‑Arnold Network) 기반의 가변적 B‑spline basis 함수 ϕ(x) 로 교체함으로써, 각 메시지를 비선형 함수 공간에 매핑한다. 이는 학습 가능한 비선형 기저함수를 통해 복잡한 비대칭 패턴을 더 정밀하게 모델링할 수 있게 한다. 특히, 방향별 인접 행렬 A_out, A_in을 별도로 정규화해 소스와 타깃 역할을 구분하는 메시지 패싱을 수행한다.

셋째, 멀티모달 융합 모듈은 선형 어텐션과 KAN 기반 비선형 변환을 병렬로 적용한다. 어텐션 단계에서는 각 뷰의 임베딩에 가중치를 학습해 중요한 정보를 강조하고, KAN 기반 비선형 단계에서는 임베딩을 연결(concatenation)한 뒤 다시 KAN을 통과시켜 뷰 간 상호작용을 비선형적으로 조합한다. 최종적으로 소스 임베딩 S와 타깃 임베딩 T는 각각 “선형‑어텐션 + 비선형‑KAN” 형태로 결합된다.

디코더는 양방향 바이리니어 형태 ˆy_{u→v}=σ(S_u^T M T_v) 로 구현되어, 소스‑타깃 임베딩 간의 내적을 학습 가능한 매트릭스 M 으로 변환 후 시그모이드로 확률을 산출한다. 손실 함수는 표준 이진 교차 엔트로피이며, 음성 샘플을 1:1 비율로 언더샘플링한다.

실험에서는 DrugBank 기반 DS1, DS2 두 데이터셋을 8:1:1 비율로 트랜스덕티브하게 분할하고 5‑fold 교차 검증을 수행했다. MGKAN은 AUROC, AUPRC, F1 모두에서 기존 최첨단 모델(예: DGA‑T‑DDI, DirGNN, MA‑VGAE 등)을 압도했으며, 특히 비대칭 방향 예측(Task 2)에서 3~5%p 이상의 개선을 기록했다. Ablation 실험은 KAN 레이어 제거 시 성능이 가장 크게 감소함을 보여, 비선형 기저함수의 중요성을 입증한다. 또한, 어텐션과 KAN 기반 융합을 각각 제외했을 때도 유의미한 성능 저하가 발생해 두 모듈이 상호 보완적임을 확인한다.

사례 연구에서는 MGKAN이 예측한 상위 10개 약물 쌍 중 7개가 실제 비대칭 DDI로 확인되었고, 2개는 대칭 관계, 1개는 아직 데이터베이스에 등재되지 않은 새로운 상호작용으로 제시되었다. 이는 모델이 기존 지식에 없는 잠재적 위험을 탐지할 수 있음을 시사한다.

결론적으로, MGKAN은 (1) 다중모달 그래프 구조, (2) KAN 기반 비선형 메시지 패싱, (3) 혼합형 융합 전략이라는 세 축을 통해 비대칭 DDI 예측에서 기존 방법을 뛰어넘는 성능을 달성하였다. 향후 연구에서는 다중관계 DDI(예: 상호작용 유형별)와 추가적인 약물 모달리티(예: 텍스트 설명, 임상 메타데이터) 통합을 통해 모델의 일반화와 해석 가능성을 더욱 강화할 계획이다.


댓글 및 학술 토론

Loading comments...

의견 남기기