잠재공간에서 가법적 교란 표현을 학습하여 새로운 조합 효과를 예측하는 방법
초록
본 논문은 유전자 노크다운·약물 처리와 같은 교란이 관측 데이터에 미치는 영향을, 교란이 잠재공간에서 평균 이동(mean shift)으로 작용한다는 가정 하에 모델링한다. 교란 효과를 선형적으로 합칠 수 있는 잠재표현을 학습하고, 충분히 다양하게 구성된 훈련 교란 집합이 주어질 때 잠재표현과 교란 효과를 정규직교 변환(orthogonal transformation)까지 식별 가능함을 이론적으로 증명한다. 이를 기반으로 제안된 ‘Perturbation Distribution AutoEncoder(PDAE)’는 분포 수준의 유사성을 최대화하며, 보지 못한 교란 조합에 대한 정확한 분포 예측을 수행한다.
상세 분석
본 연구는 교란 효과의 외삽(extrapolation) 문제를 “분포적 회귀(distributional regression)”라는 관점에서 정의하고, 관측값 x∈ℝ^d와 교란 라벨 a∈ℝ^K 사이의 조건부 분포 P_X|a 를 직접 모델링한다는 점에서 기존의 평균 예측(mean prediction) 접근법과 차별화된다. 핵심 가정은 교란이 잠재공간 Z∈ℝ^{d_Z}에서 평균 이동 W a 로 표현된다는 것이며, 여기서 W∈ℝ^{d_Z×K}는 교란별 이동 벡터를 담은 행렬이다. 교란이 적용된 잠재 변수는 Z_pert = Z_base + W a 로 정의되고, 비선형(또는 확률적) 디코더 f가 Z_pert 과 추가 노이즈 ε를 받아 관측 x = f(Z_pert, ε) 를 생성한다.
정리된 가정 하에 저자들은 두 가지 주요 이론적 결과를 제시한다. 첫 번째는 정체성(identifiability) 결과로, 훈련 교란 집합 {a_0,…,a_M}이 충분히 다양하고(즉, 행렬 A =
댓글 및 학술 토론
Loading comments...
의견 남기기