브릴루앙 영상 데이터의 다변량 분석 지도학습과 비지도학습 활용
초록
본 논문은 브릴루앙 영상에서 얻어지는 고차원 스펙트럼 데이터를 기존의 단일 피크 피팅 방식 대신 다변량 분석 기법으로 처리한다. 주성분 분석(PCA), 정점 성분 분석(VCA), 선형 판별 분석(LDA), 계층적 군집 분석(HCA) 등 지도·비지도 학습 알고리즘을 적용해 스펙트럼 언믹싱, 분류, 세그멘테이션을 수행한다. 실험은 인공 팬텀과 살아있는 3T3L1 지방세포에 대해 진행했으며, 제안된 방법이 기존 피팅 대비 100배 빠른 처리 속도와 향상된 대비·세부 정보를 제공함을 보였다.
상세 분석
이 연구는 브릴루앙 영상(Brillouin Imaging, BI)의 핵심 과제인 저신호‑고노이즈 스펙트럼에서 물리적 파라미터(브릴루앙 이동 및 선폭)를 정확히 추출하는 문제를 다변량 통계·머신러닝 기법으로 재구성한다. 기존에는 각 픽셀마다 단일 피크를 최소제곱 피팅해 평균 이동과 선폭을 구했지만, 이는 높은 신호대잡음비(SNR)를 전제하고 복합 조직에서는 혼합 스펙트럼으로 인한 편향이 발생한다. 논문은 먼저 데이터 전처리 단계에서 배경제거, 표준 정규화(SNV), 기존 연구에서 제안된 노이즈 억제 방법을 적용해 노이즈 기반 잔차 행렬 N을 명시한다.
비지도 학습에서는 주성분 분석(PCA)을 이용해 데이터 차원을 축소하고, 주요 변동을 설명하는 몇 개의 주성분만을 선택한다. PCA는 선형 변환이므로 모든 스펙트럼을 새로운 직교 좌표계에 투사해 잡음이 높은 고차원 성분을 자연스럽게 차단한다. 그러나 PCA는 실제 엔드멤버(순수 스펙트럼)와의 기하학적 관계를 고려하지 않아 스펙트럼 언믹싱에 한계가 있다. 이를 보완하기 위해 정점 성분 분석(VCA)을 도입한다. VCA는 고차원 스펙트럼 공간에서 데이터가 단순형(simplex) 형태를 이룬다고 가정하고, 그 정점을 순수 엔드멤버 스펙트럼으로 추정한다. 엔드멤버 수 p를 사전에 지정하거나 데이터 분산 기준으로 자동 선택할 수 있으며, 정점 수가 늘어날수록 복합 조직의 미세구조를 더 정밀하게 분리한다. VCA는 PCA보다 연산 속도가 빠우면서도 잡음에 대한 내성이 뛰어나, 복합 조직에서의 언믹싱 정확도가 현저히 향상된다.
지도 학습에서는 선형 판별 분석(LDA)를 활용한다. LDA는 클래스 간 분산(SII)과 클래스 내 분산(SI)을 각각 최대·최소화하는 투영 벡터를 찾음으로써, 사전에 라벨링된 스펙트럼을 고차원 공간에서 최적 구분한다. 스펙트럼 행렬이 종종 특이행렬이 되는 문제를 해결하기 위해 PCA 혹은 VCA에서 얻은 저차원 점수를 입력 특징으로 사용한다. 이렇게 하면 차원 축소와 분류를 동시에 수행할 수 있어, 제한된 학습 데이터(브릴루앙 데이터는 획득 비용이 높음)에서도 안정적인 분류가 가능하다.
비지도 군집화로는 계층적 군집 분석(HCA)을 적용한다. 거리 행렬을 기반으로 Ward 방법을 사용해 픽셀 간 유사성을 단계적으로 결합하고, 최종적으로 원하는 군집 수 C를 지정해 세그멘테이션을 수행한다. HCA는 사전 라벨이 필요 없으며, 복합 조직 내에서 자연스럽게 형성되는 스펙트럼 군집을 탐지한다. 다만 거리 계산 비용이 O(N²)으로 커서 대규모 데이터셋에서는 사전 차원 축소가 필수적이다.
실험에서는 2D 팬텀과 살아있는 3T3L1 지방세포를 대상으로 위 알고리즘들을 적용했다. 팬텀에서는 두 개의 알려진 물질(예: 물과 글리세린) 혼합 비율을 정확히 복원했으며, VCA 기반 언믹싱이 PCA 대비 5% 정도 낮은 평균 제곱 오차를 보였다. 살아있는 세포에서는 세포질, 핵, 세포 외 기질을 각각 다른 엔드멤버로 분리해, 기존 피팅 방식에서는 흐릿하게 보였던 경계가 선명하게 드러났다. 전체 처리 시간은 전통적인 피팅이 수십 초에서 수분이 걸리는 반면, VCA·LDA·HCA 조합은 0.1~0.5초 수준으로 10² 배 가량 가속화되었다.
결과적으로, 다변량 분석은 브릴루앙 영상의 스펙트럼 정보를 보다 풍부하게 활용할 수 있게 하며, 실시간 혹은 근접 실시간으로 이미지 품질을 향상시키는 데 기여한다. 특히 VCA 기반 언믹싱과 LDA 기반 분류는 임상 현장에서 조직 병변을 빠르게 식별하고, 수술 중 실시간 피드백을 제공하는 잠재력을 가진다.
댓글 및 학술 토론
Loading comments...
의견 남기기