다목적 LCMS 정량화 툴 MassChroQ 소개

다목적 LCMS 정량화 툴 MassChroQ 소개
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

MassChroQ는 고해상도·저해상도 장비와 라벨링·라벨프리 실험 모두에 적용 가능한 LC‑MS 정량화 소프트웨어이다. XIC 기반 피크 면적 통합, 두 가지 정렬 알고리즘, XML 기반 전 과정 설정을 제공하며, 저렴한 CV(1.4%)와 높은 정량 상관계수(0.98)를 입증하였다.

상세 분석

MassChroQ는 기존 정량화 도구들이 특정 해상도나 라벨링 전략에 국한되는 문제를 해결하기 위해 설계되었다. 핵심 알고리즘은 추출이온크로마토그램(XIC) 기반으로, m/z와 RT 정보를 이용해 전체 LC‑MS 데이터를 정량화한다. 저해상도(LR) 데이터에서는 0.3 Th, 고해상도(HR) 데이터에서는 10 ppm의 윈도우를 적용해 신호를 추출함으로써, 장비 해상도 차이를 보정한다.

전처리 단계에서는 평균 필터링 후 수학적 형태학(morphological) 연산인 ‘클로징’과 ‘오프닝’을 적용한다. 클로징은 얕은 골짜기를 메우고 피크의 최대값을 보존하며, 오프닝은 얇은 스파이크를 제거한다. 이러한 처리 후 피크 경계가 결정되고, 원본 XIC에서 면적을 적분해 정량값을 산출한다.

정렬 알고리즘은 두 가지를 제공한다. 첫 번째는 OBI‑Warp(Ordered Bijective Interpolated Warping)으로, MS 스캔만을 이용해 전역적인 시간 왜곡을 보정한다. 두 번째는 MS/MS 기반 정렬로, 동일 펩타이드의 MS/MS RT 차이를 랜드마크로 삼아 선형 보간을 수행한다. 두 방법 모두 평균·중위수 필터링을 통해 저주파 잡음을 제거한다. 정렬 후 동일 그룹 내 LC‑MS 파일 간에 피크 매칭을 수행하며, MS/MS 식별이 존재하는 경우에만 매칭을 허용한다.

입력 파일은 mzXML·mzML 형식을 지원하고, 식별 결과는 X!Tandem, TSV, CSV 등 다양한 포맷으로 제공될 수 있다. 사용자 설정은 XML 스키마 기반 masschroqML 파일로 정의되며, 실험 유형(라벨링, 라벨프리, 분획 등)에 맞는 템플릿이 제공된다. 결과는 TSV, gnumeric 스프레드시트, XML 등으로 출력돼 통계 분석이나 데이터베이스 업로드에 바로 활용 가능하다.

성능 평가는 Saccharomyces cerevisiae 전체 단백질 추출물에 BSA 펩타이드를 다양한 농도로 스파이크한 12개의 LC‑MS 런(LR·HR 각각 6개)에서 수행되었다. 전체 5 831개의 펩타이드(556단백질) 중 4 936개의 XIC가 HR, 5 936개의 XIC가 LR에서 추출되었다. HR 데이터에서 97 %의 펩타이드가 5회 중 최소 4회 재현성을 보였으며, LR에서는 67 %에 머물렀다. 이는 LR 데이터의 노이즈와 복합성에 기인한다. 정량값의 평균 CV는 HR 1.31 %, LR 1.40 %로 매우 낮았으며, BSA 펩타이드의 농도와 정량값 사이의 상관계수는 HR 0.98, LR 0.98(일부 펩타이드 제외)로 높은 선형성을 보였다.

계산 효율성 측면에서 6 GB 데이터(12 런)와 5 000여 개 XIC를 처리하는 데 2.93 GHz CPU 기준 1시간이 소요되었으며, 대부분의 시간은 LR 비중심 데이터 처리에 사용되었다.

전반적으로 MassChroQ는 해상도와 라벨링 방식에 구애받지 않는 범용 정량화 파이프라인을 제공하며, 오픈소스·GPL v3 라이선스로 배포돼 연구 커뮤니티의 자유로운 확장과 통합을 가능하게 한다. 향후 SRM 데이터 지원, GUI 기반 파라미터 튜닝, 처리 속도 최적화 등이 계획되어 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기