FUNGAR: 메타게놈 단일 읽기로 항진균 저항성 변이 탐지 파이프라인
초록
FUNGAR는 DIAMOND 기반 번역 정렬과 FungAMR 데이터베이스를 활용해 짧은 메타게놈 읽기에서 항진균 저항성 유전자와 아미노산 변이를 직접 검출한다. 합성 데이터와 실제 환경·임상 샘플에 적용해 알려진 저항성 변이(L98H, F200Y 등)를 정확히 찾아내며, 사용자 정의 데이터베이스 구축도 지원한다.
상세 분석
FUNGAR는 기존 박테리아 중심 저항성 탐지 도구가 갖는 한계를 극복하기 위해 설계되었다. 핵심은 DIAMOND의 blastx 모드를 이용해 FASTQ 파일의 읽기를 6개의 모든 개방 독서 프레임(ORF)으로 번역하고, 번역된 서열을 FungAMR에 수록된 단백질 서열과 매칭하는 것이다. 기본 파라미터는 최소 번역 길이 50 aa(150 bp 읽기 기준)이며, 사용자는 최소 쿼리 커버리지, 최소 동질성(%), 그리고 번역에 사용할 유전 코드를 자유롭게 조정할 수 있다. 매칭 결과는 pandas 기반 스크립트로 파싱돼, 데이터베이스에 정의된 변이 위치와 아미노산 교체를 비교해 실제 변이를 식별한다. 변이가 확인되면 해당 변이가 연관된 항진균제(azoles, echinocandins, polyenes 등)와 함께 CSV 형식의 구조화된 보고서로 출력된다.
합성 데이터 검증에서는 Pneumocystis jirovecii DHFR 유전자의 두 번째 잔기에 D2E(저항성)와 D2F(중성) 변이를 삽입한 8개의 150 bp 페어엔드 읽기를 사용했다. FUNGAR는 D2E만을 정확히 검출했으며, 변이가 전·후보(Forward/Reverse)와 서로 다른 ORF에 위치해도 인식한다는 점을 입증했다. 실제 데이터에서는 두 가지 시나리오가 적용되었다. 첫 번째는 Rhodes et al. (2022)의 A. fumigatus 환경 분리주 10개(그중 8개는 azole 저항성)이며, FUNGAR는 Cyp51A L98H 변이를 재현하고, FungAMR에 포함된 Fks, Hmg1, Hmg2, Sdh 등 추가 저항성 유전자 변이도 탐지했다. 두 번째는 세 명의 낭포성 섬유증 환자에서 채취한 메타게놈 샘플(총 11개)로, Aspergillus와 Candida 종을 대상으로 별도 데이터베이스를 구축해 분석했다. 환자 A에서는 β‑tubulin F200Y, 환자 B와 C에서는 Sdh H270R, 환자 C에서는 Candida Erg1 D153E 변이를 각각 검출해 azole 저항성을 시사했다.
FUNGAR의 장점은 (1) 어셈블리 없이 바로 읽기 수준에서 변이를 탐지해 저밀도 종이나 파편화된 게놈에서도 정보 손실을 최소화한다, (2) DIAMOND의 고속·고감도 정렬 덕분에 대규모 메타게놈에도 실시간에 가까운 처리 속도를 제공한다, (3) 사용자 정의 DIAMOND 데이터베이스와 CSV 형식 변이 리스트를 통해 새로운 종이나 최신 저항성 변이를 손쉽게 추가할 수 있다. 다만, 현재는 단백질 수준 변이만을 탐지하므로 전사·후생적 조절 메커니즘이나 복제수 변이에 대한 검출은 제한적이며, 변이의 기능적 임상 의미는 데이터베이스에 의존한다는 점에서 지속적인 업데이트가 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기