전문가 피드백을 활용한 인과 구조 탐색: 베이지안 선호 추출
초록
본 논문은 관측 데이터로부터 얻은 초기 베이지안 인과 그래프 사후분포에 전문가의 불확실한 판단을 순차적으로 결합하는 프레임워크인 CaPE를 제안한다. 전문가 응답을 3‑값(→, ←, 없음) 범주형으로 모델링하고, 입자 기반 필터링으로 사후를 업데이트하며, 기대 정보이득(EIG) 기반의 BALD형 쿼리 선택으로 제한된 예산 안에서 그래프 불확실성을 효율적으로 감소시킨다. 합성 데이터, 단백질 신호망, 인간 유전자 교란 실험 등에서 기존 방법보다 빠른 수렴과 높은 구조 회복률을 보였다.
상세 분석
CaPE는 두 단계의 베이지안 추론을 결합한다. 첫 번째 단계는 관측 데이터 X로부터 임의의 블랙박스 인과 탐색 알고리즘(예: MCMC, 부트스트랩, 변분 방법 등)을 이용해 초기 사후 q₀(W|X)를 샘플링한다. 여기서 W는 가중치 행렬이며, A=𝟙(W≠0)는 DAG의 인접 행렬이다. 두 번째 단계는 전문가의 판단 Y를 확률적으로 모델링한다. 저자는 Yᵢⱼ∈{0,1,2}라는 3‑값 라벨을 정의하고, 이를 W에 대한 계층적 로지스틱 모델 p_θ(Yᵢⱼ|W)로 매핑한다. 구체적으로, (i,j) 쌍에 대해 절대 증거 aᵢⱼ = max{sᵢ→ⱼ, sⱼ→ᵢ}와 방향 차이 dᵢⱼ = sᵢ→ⱼ – sⱼ→ᵢ를 계산한다. 여기서 sᵢ→ⱼ = g(|Wᵢⱼ|^γ) + λ·ϕᵢ→ⱼ이며, g는 로그형 링크, γ는 스케일, ϕ는 v‑structure, 사이클 위험 등 구조적 특징을 포함할 수 있다. 이후 edge‑existence 확률 p_edge = σ(β_edge·aᵢⱼ)와, 존재 시 방향 확률 p_{i→j|edge}=σ(β_dir·dᵢⱼ)를 로지스틱 함수로 정의한다. 최종적으로 p(Yᵢⱼ=2)=1−p_edge, p(Yᵢⱼ=1)=p_edge·p_{i→j|edge}, p(Yᵢⱼ=0)=p_edge·(1−p_{i→j|edge})가 된다. β_edge와 β_dir는 각각 전문가의 신뢰도와 결정성을 조절한다.
사후 업데이트는 입자 기반 근사 q_t(W)≈∑{s=1}^S w_t^{(s)} δ{W^{(s)}} 로 수행된다. 초기 입자는 q₀에서 샘플링하고, 각 라운드 t에서 관측된 Y^{(t)}{i_t j_t}에 대해 가중치를 w_t^{(s)}∝w{t−1}^{(s)}·p_θ(Y^{(t)}_{i_t j_t}|W^{(s)}) 로 재계산한다. 입자 가중치가 편중되면 ESS=1/∑(w_t^{(s)})²가 임계값 δ_s·S 이하가 될 때 재샘플링을 수행하고, 다양성을 유지하기 위해 가벼운 Metropolis–Hastings 재활성화(K_t)를 적용한다. 제안된 편집 연산은 단일 에지 추가·삭제·반전·가중치 조정이며, 사이클을 만들 경우 즉시 거부한다. 이 과정은 사후 분포를 정확히 유지하면서 입자 집합의 다양성을 보존한다.
쿼리 선택은 기대 정보이득(EIG)을 BALD 방식으로 근사한다. 구체적으로, 후보 (i,j)에 대해 현재 사후 예측 분포 p̂(Yᵢⱼ|D_{1:t})를 계산하고, 관측 후 사후 엔트로피 감소량을 추정한다. 이는 저차원(3‑값) 범주형 분포에 대해 효율적으로 계산 가능하므로, 전체 DAG 공간을 탐색하는 비용을 크게 절감한다. 따라서 제한된 질문 예산 내에서 전역 구조 불확실성을 최대한 감소시킬 수 있다.
실험에서는 (1) 2050노드 합성 DAG, (2) 실제 단백질 신호망 데이터, (3) 인간 유전자 교란 벤치마크를 사용했다. 비교 대상은 무작위 쿼리, 변동도 기반 불확실성 쿼리, 기존 하드 제약 방식이다. 결과는 CaPE가 동일 예산에서 사후 평균 구조 엔트로피를 3045% 더 빠르게 감소시키고, SHD(Structure Hamming Distance)와 AUC(Edge Orientation) 측면에서 유의미하게 우수함을 보여준다. 특히 전문가의 오류율이 10~20% 수준일 때도 견고하게 작동한다는 점이 강조된다.
이 논문의 주요 기여는 (i) 관측 기반 사후와 전문가 피드백을 일반적인 베이지안 프레임워크 안에서 결합한 점, (ii) 3‑값 로지스틱 전문가 모델을 통해 불확실하고 편향된 인간 판단을 정량화한 점, (iii) 입자 필터링과 재활성화를 이용한 효율적인 DAG 사후 근사, (iv) BALD‑형 EIG를 활용한 저비용 쿼리 선택 전략이다. 이러한 요소들은 인과 구조 학습이 데이터와 인간 지식 사이의 상호작용을 필요로 하는 실제 과학·의료 현장에 바로 적용 가능하도록 만든다.
댓글 및 학술 토론
Loading comments...
의견 남기기