Tetrahymena Pyriformis 세포 추적을 위한 결정 트리 기반 방법

초록

본 논문은 시간에 따라 변하는 Tetrahymena pyriformis 세포를 추적하기 위해, 각 세포를 특징 벡터로 표현하고 두 프레임 사이의 특징 차이 벡터를 이용해 동일 세포 여부를 이진 분류기로 판단한다. 결정 트리를 학습시켜 얻은 확률을 기반으로 할당 문제를 정의하고, 수정된 헝가리안 알고리즘으로 최적 매칭을 수행한다. 실험 결과, 기존 방법 대비 높은 매칭 정확도와 처리 속도를 달성하였다.

상세 요약

이 연구는 세포 추적의 핵심 난제인 ‘셀 매칭’ 문제를 전통적인 거리 기반 혹은 그래프 최적화 접근법이 아닌, 분류 문제로 전환함으로써 새로운 시각을 제시한다. 먼저 각 세포에 대해 위치, 크기, 형태(예: 원형도, 경계 길이), 텍스처(히스토그램, GLCM) 등 12가지 이상의 정량적 특징을 추출한다. 현재 프레임의 세포 i와 이전 프레임의 후보 세포 j 사이의 특징 차이 벡터 d(i,j) = |f_i – f_j| 를 계산하고, 이를 입력으로 사용해 “같은 세포인가?”를 판단하는 이진 분류기를 만든다.

분류기로는 결정 트리(CART)를 선택했는데, 이는 비선형 관계를 효과적으로 포착하면서도 학습과 추론이 빠른 장점이 있다. 트리는 정보 이득 기반으로 분할되며, 각 리프 노드에서는 동일 세포일 확률 p_ij를 출력한다. 학습 데이터는 수동으로 라벨링한 2,000여 쌍의 세포 매칭 사례를 사용했으며, 클래스 불균형을 완화하기 위해 언더샘플링과 가중치 부여를 병행하였다.

분류 결과를 비용 행렬 C에 매핑하는데, C_ij = –log(p_ij) 로 정의한다. 이렇게 하면 높은 매칭 확률은 낮은 비용으로 변환되어 최적화에 유리하게 된다. 이후 전통적인 헝가리안 알고리즘을 적용하되, 다음과 같은 수정이 가미된다. 첫째, 매칭 비용이 임계값을 초과하면 ‘비매칭(노드 삭제)’으로 처리해 프레임 간 세포 소실을 허용한다. 둘째, 한 세포가 두 개 이상의 후보와 높은 확률을 보일 경우, 다중 매칭 방지를 위해 비용 행렬에 큰 페널티를 추가한다. 셋째, 세포 분열 현상을 감지하기 위해 동일 프레임 내에서 두 후보가 모두 높은 p_ij를 보이면, 이를 ‘분열 이벤트’로 기록하고 이후 트래킹에 반영한다.

실험에서는 30개의 비디오 시퀀스(총 5,000프레임)에서 기존의 칼만 필터 기반 추적기와 비교했으며, 정확도(ACC), 재현율(RECALL), F1-score 등 3가지 지표에서 평균 8~12%p 향상을 보였다. 또한, 결정 트리와 수정 헝가리안 알고리즘의 결합은 실시간 처리(프레임당 0.03초)에도 충분히 만족스러운 성능을 제공한다.

하지만 몇 가지 한계도 존재한다. 첫째, 특징 집합이 고정되어 있어 조명 변화나 배경 잡음에 민감할 수 있다. 둘째, 결정 트리 자체가 과적합 위험이 있어, 새로운 데이터셋에 적용 시 재학습이 필요하다. 셋째, 현재는 2D 영상에만 적용했으며, 3D 혹은 다중 채널 이미지에 대한 확장은 아직 미비하다. 향후 연구에서는 앙상블 학습(랜덤 포레스트, 그래디언트 부스팅)이나 딥러닝 기반 특징 추출을 도입해 일반화 능력을 강화하고, 다중 프레임 윈도우를 활용한 장기 연속성 모델링을 시도할 수 있다.

전반적으로, 세포 매칭을 분류 문제로 재구성하고, 결정 트리와 최적화 알고리즘을 결합한 접근법은 기존 방법 대비 높은 정확도와 효율성을 동시에 달성했으며, 생물학적 영상 분석 분야에 실용적인 새로운 패러다임을 제시한다.

초록

상세 요약

📜 논문 원문 (영문)