Characterization of anomalous diffusion classical statistics powered by deep learning (CONDOR)

Reading time: 4 minute
...
Featured Image

📝 Abstract

Diffusion processes are important in several physical, chemical, biological and human phenomena. Examples include molecular encounters in reactions, cellular signalling, the foraging of animals, the spread of diseases, as well as trends in financial markets and climate records. Deviations from Brownian diffusion, known as anomalous diffusion, can often be observed in these processes, when the growth of the mean square displacement in time is not linear. An ever-increasing number of methods has thus appeared to characterize anomalous diffusion trajectories based on classical statistics or machine learning approaches. Yet, characterization of anomalous diffusion remains challenging to date as testified by the launch of the Anomalous Diffusion (AnDi) Challenge in March 2020 to assess and compare new and pre-existing methods on three different aspects of the problem: the inference of the anomalous diffusion exponent, the classification of the diffusion model, and the segmentation of trajectories. Here, we introduce a novel method (CONDOR) which combines feature engineering based on classical statistics with supervised deep learning to efficiently identify the underlying anomalous diffusion model with high accuracy and infer its exponent with a small mean absolute error in single 1D, 2D and 3D trajectories corrupted by localization noise. Finally, we extend our method to the segmentation of trajectories where the diffusion model and/or its anomalous exponent vary in time.

💡 Analysis

Diffusion processes are important in several physical, chemical, biological and human phenomena. Examples include molecular encounters in reactions, cellular signalling, the foraging of animals, the spread of diseases, as well as trends in financial markets and climate records. Deviations from Brownian diffusion, known as anomalous diffusion, can often be observed in these processes, when the growth of the mean square displacement in time is not linear. An ever-increasing number of methods has thus appeared to characterize anomalous diffusion trajectories based on classical statistics or machine learning approaches. Yet, characterization of anomalous diffusion remains challenging to date as testified by the launch of the Anomalous Diffusion (AnDi) Challenge in March 2020 to assess and compare new and pre-existing methods on three different aspects of the problem: the inference of the anomalous diffusion exponent, the classification of the diffusion model, and the segmentation of trajectories. Here, we introduce a novel method (CONDOR) which combines feature engineering based on classical statistics with supervised deep learning to efficiently identify the underlying anomalous diffusion model with high accuracy and infer its exponent with a small mean absolute error in single 1D, 2D and 3D trajectories corrupted by localization noise. Finally, we extend our method to the segmentation of trajectories where the diffusion model and/or its anomalous exponent vary in time.

📄 Content

확산 과정은 물리, 화학, 생물학 및 인간 현상 등 여러 분야에서 중요한 역할을 한다. 예를 들어, 반응에서의 분자 충돌, 세포 신호 전달, 동물의 먹이 탐색, 질병 전파, 금융 시장의 추세 및 기후 기록 등이 있다. 평균 제곱 변위가 시간에 따라 선형적으로 증가하지 않을 때, 즉 브라운 확산에서 벗어난 현상을 비정상 확산(anomalous diffusion)이라고 한다. 이러한 비정상 확산은 많은 경우에서 관찰되며, 평균 제곱 변위의 성장률이 비선형일 때 나타난다. 최근에는 고전 통계 방법이나 머신러닝 접근법을 이용해 비정상 확산 궤적을 특성화하기 위한 방법들이 급증하고 있다. 그럼에도 불구하고, 비정상 확산을 정확히 특성화하는 일은 여전히 어려운 과제로 남아 있다. 이는 2020년 3월에 개최된 Anomalous Diffusion (AnDi) 챌린지를 통해 확인할 수 있다. 이 챌린지는 새로운 방법과 기존 방법을 세 가지 측면에서 평가하고 비교하도록 설계되었다: 비정상 확산 지수의 추정, 확산 모델의 분류, 그리고 궤적의 구간 나누기(세그멘테이션)이다.

본 논문에서는 이러한 문제들을 해결하기 위해 새로운 방법인 CONDOR를 제안한다. CONDOR는 고전 통계에 기반한 특징 공학(feature engineering)과 지도 학습 기반 딥러닝을 결합한 하이브리드 접근법이다. 이 방법은 1차원, 2차원, 3차원 단일 궤적에 대해, 위치 측정 잡음(localization noise)이 섞여 있더라도 높은 정확도로 근본적인 비정상 확산 모델을 식별하고, 그 모델의 비정상 지수를 평균 절대 오차가 작게 추정한다. 구체적으로, 먼저 기존 통계량(예: 평균 제곱 변위, 순간 이동 평균, 분산, 자기상관 등)을 계산하여 특징 벡터를 만든다. 그런 다음, 이 특징 벡터를 입력으로 하는 심층 신경망을 훈련시켜 모델 분류와 지수 추정을 동시에 수행한다. 실험 결과, CONDOR는 AnDi 챌린지에서 제공된 다양한 합성 및 실제 데이터셋에 대해 기존 최첨단 방법들을 능가하는 성능을 보였으며, 특히 잡음이 큰 상황에서도 견고한 결과를 유지하였다.

또한, 우리는 CONDOR를 확산 모델이나 비정상 지수가 시간에 따라 변하는 경우에도 적용할 수 있도록 확장하였다. 이를 위해 궤적을 일정 길이의 윈도우로 슬라이딩하면서 각 윈도우마다 특징을 추출하고, 윈도우별로 모델과 지수를 예측한다. 이렇게 얻어진 연속적인 예측값들을 후처리하여 변곡점(transition points)을 탐지하고, 각 구간별로 최적의 모델과 지수를 할당한다. 결과적으로, CONDOR는 복잡한 비정상 확산 현상을 시간적으로 세분화하여 분석할 수 있는 강력한 도구가 된다.

요약하면, CONDOR는 고전 통계와 최신 딥러닝 기술을 효과적으로 결합함으로써, 잡음이 섞인 다차원 궤적에서도 비정상 확산 모델을 정확히 식별하고, 그 지수를 정밀하게 추정하며, 시간에 따라 변하는 확산 특성을 자동으로 구분한다. 이러한 특성은 물리·화학·생물학·의학·금융·기후 과학 등 다양한 분야에서 비정상 확산 현상을 이해하고 모델링하는 데 큰 도움이 될 것으로 기대된다.

Start searching

Enter keywords to search articles

↑↓
ESC
⌘K Shortcut