다중 3D 인간 포즈 가설 생성 및 2D 관절 검출 일치

본 논문은 단일 RGB 이미지에서 2D 관절 검출 결과에 일관되는 여러 개의 다양하고 해부학적으로 타당한 3D 인간 포즈를 생성하는 방법을 제안한다. 기존 데이터 기반 모델의 편향을 없애기 위해 해부학적 제약만을 이용한 균등(unbiased) 생성 모델을 설계하고, 이를 조건부 샘플링·거부 샘플링 전략과 결합해 깊이 모호성·관절 가림·2D 검출 오류 등으로 인한 불확실성을 다루며, Human3.6M 데이터셋을 통해 정량·정성 평가를 수행한다.

저자: Ehsan Jahangiri, Alan L. Yuille

본 논문은 단일 RGB 이미지에서 2D 관절 검출 결과에 일관되는 다수의 3D 인간 포즈 가설을 생성하는 새로운 프레임워크를 제시한다. 3D 포즈 추정은 2D 투영 과정에서 깊이 정보가 손실되기 때문에 본질적으로 ill‑posed 문제이며, 특히 관절 가림이나 2D 검출 오류가 존재할 경우 가능한 3D 해가 급격히 늘어난다. 기존 연구들은 대규모 MoCap 데이터셋을 기반으로 사전 학습된 확률 모델이나 딥 네트워크를 이용해 단일 최적 포즈를 추정했지만, 이러한 데이터는 특정 동작(예: 서 있는 자세)으로 편중돼 있어 드물거나 새로운 자세에 대한 일반화가 제한된다. 이를 해결하기 위해 저자들은 ‘해부학적 제약만을 만족하는 균등(unbiased) 생성 모델’을 설계한다. 핵심 아이디어는 인간 골격을 여러 파트(골반, 상체, 팔·다리)로 분해하고, 각 파트를 해부학적 관절 각도 범위와 골격 길이 비율에 맞게 무작위로 샘플링한 뒤, kinematic chain 구조에 따라 결합해 전체 포즈를 만든다. 이 과정에서 사용된 관절 각도 제한은 Akhter & Black

다중 3D 인간 포즈 가설 생성 및 2D 관절 검출 일치

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기