깊이 이미지 기반 압력 분포 합성의 현실성 향상
초록
본 논문은 침대 위 환자의 깊이 영상을 입력으로 하여 접촉 압력 지도를 생성하는 기존 모델들의 물리적 비현실성 문제를 해결한다. 인포메드 라티트 스페이스(ILS)와 무게 최적화 손실(WOL)을 도입해 인체의 체중·신장·성별 정보를 잠재 공간에 직접 결합하고, 조건부 브라운니언 브리지 확산 모델(BBDM) 및 그 라티트 버전(LBBDM)을 활용해 고품질 압력 분포를 합성한다. 실험 결과 ILS‑BBDM은 세밀한 압력 패턴을 제공하지만 연산 비용이 높고, LBBDM은 빠른 추론 속도와 경쟁력 있는 성능을 보인다. 제안 방법은 비침습적인 비전 기반 환자 모니터링에 실시간 적용 가능함을 입증한다.
상세 분석
이 연구는 병원 침대에서 환자의 압력 궤양을 예방하기 위해 비접촉식으로 압력 분포를 추정하는 문제에 초점을 맞춘다. 기존의 딥러닝 기반 접근법(예: BPBnet, ATTNFNET+CGAN)은 깊이 이미지만을 이용해 압력을 예측했으나, 체중·신장·성별 등 인체 특성에 대한 물리적 연관성을 모델에 명시적으로 반영하지 못해 실제 무게와 압력 총합이 일치하지 않는 비현실적인 결과를 초래했다. 이를 해결하기 위해 저자는 두 가지 핵심 모듈을 설계했다.
첫 번째인 인포메드 라티트 스페이스(Informed Latent Space, ILS)는 인체의 체질량(BM), 키, 성별을 각각 선형 임베딩(MLP)으로 변환한 뒤, 다중 헤드 셀프‑어텐션을 통해 파라미터 간 상호관계를 학습한다. 이렇게 얻어진 인체 특성 토큰은 크로스‑어텐션에서 잠재 표현 z의 키(key)로 사용되어, z에 직접적인 조건부 정보를 주입한다. 결과적으로 디코더는 ‘정보가 풍부한’ 잠재 변수 ˜z를 받아 압력 맵을 복원함으로써, 동일한 깊이 이미지에 대해 체중·키·성별을 조정하면 물리적으로 일관된 압력 변화를 즉시 생성할 수 있다.
두 번째는 무게 최적화 손실(Weight Optimization Loss, WOL)이다. 압력 매트 센서의 총합은 사람의 무게와 중력 가속도(g)의 곱으로 근사될 수 있다(식 8‑9). 따라서 예측 압력 ˆp의 전체 합을 이용해 추정 무게 ˆM을 계산하고, 실제 무게 M과의 절대 차이를 최소화하는 L_WOL = | Σ_i (p_i – ˆp_i) | 를 손실에 포함한다. 이 손실은 기존의 L2·MSE와 SSIM 손실에 가중치 γ를 두어 결합함으로써, 픽셀‑레벨 정확도뿐 아니라 전체 무게 일관성까지 동시에 최적화한다.
생성 모델링 측면에서는 조건부 브라운니언 브리지 확산 모델(BBDM)과 그 라티트 버전(LBBDM)을 도입한다. BBDM은 비마르코프 과정으로, 압력 이미지 x₀에 가우시안 노이즈를 단계별로 주입하고, 역과정에서 조건(depth 이미지)와 함께 노이즈를 예측해 원본 압력을 복원한다. 여기서 ILS를 U‑Net 기반 디노이징 네트워크에 통합해, 어텐션을 통해 인체 특성 정보를 노이즈 예측 단계에 직접 전달한다. 라티트 버전인 LBBDM은 먼저 깊이 이미지 → 잠재 z 로 인코딩한 뒤, 라티트 공간에서 확산 과정을 수행한다. 이렇게 하면 고해상도 이미지에 비해 연산량이 크게 감소해 실시간 추론이 가능해진다.
학습 전략은 두 단계로 구성된다. ① ATTNFNET 기반 픽셀‑레벨 생성기(G)와 PatchGAN 판별기(D)를 사용해 adversarial loss, perceptual loss, L2 loss, WOL을 동시에 최적화한다. ② 사전 학습된 VQ‑GAN을 이용해 라티트 디코더를 강화하고, LBBDM을 라티트 공간에서 학습한다. 전체 파이프라인은 깊이 이미지 → 인포메드 라티트 ˜z → 디코더 → 압력 맵 순으로 흐르며, ILS와 WOL이 각각 라티트 생성과 최종 압력 복원 단계에 삽입된다.
실험은 공개된 Systematic Lying Postures(SLP) 데이터셋을 사용했으며, 기존 베이스라인(CGAN, ATTNFNET)과 비교했다. 정량적 지표(MSE, SSIM)에서는 ILS‑BBDM이 가장 낮은 오류와 높은 구조적 유사성을 보였고, 무게 오차는 WOL 덕분에 기존 방법 대비 30% 이상 감소했다. 그러나 BBDM은 200 단계의 확산 과정으로 추론 시간이 수 초에 이르렀으며, GPU 메모리 사용량도 높았다. 반면 LBBDM은 라티트 차원에서 50 단계만으로도 충분히 품질을 유지했으며, 추론 시간은 0.2초 수준으로 실시간 적용이 가능했다. 시각적으로도 ILS를 적용한 모델은 체중·키·성별 변화를 반영해 압력 중심이 이동하고, 압력 강도가 적절히 조절되는 현상을 보여 물리적 일관성을 확보했다.
한계점으로는 라티트 차원에서의 압력 디테일 손실, 확산 단계 수에 따른 품질‑속도 트레이드오프, 그리고 현재는 침대 위 단일 인체만을 대상으로 했다는 점을 들 수 있다. 향후 연구에서는 다중 인체·복합 자세 상황, 실시간 스트리밍 데이터, 그리고 압력‑변형 물리 모델과의 하이브리드 결합을 통해 임상 현장 적용성을 더욱 높일 수 있을 것이다.
댓글 및 학술 토론
Loading comments...
의견 남기기