강인한 고정구조 베이즈 네트워크 학습

본 논문은 구조가 사전에 알려진 이산 베이즈 네트워크를 대상으로, 전체 샘플의 ε 비율이 적대적으로 변조될 수 있는 상황에서도 차원에 의존하지 않는 오류 보장을 제공하는 최초의 다항시간 강인 학습 알고리즘을 제시한다. 샘플 복잡도는 정보이론적 하한에 근접하고, 오류는 ε에 거의 선형적으로 증가한다. 실험을 통해 합성 및 반합성 데이터에서 기존 방법을 크게 능가함을 입증한다.

저자: Yu Cheng, Ilias Diakonikolas, Daniel Kane

본 논문은 베이즈 네트워크(Bayesian Network, BN)의 강인 학습 문제를 다룬다. 베이즈 네트워크는 유향 비순환 그래프(G)와 각 노드의 조건부 확률표(CPT)로 정의되며, 변수들이 이산(0/1)인 경우가 주 대상이다. 기존 비강인 학습에서는 전체 샘플이 정확히 모델에 의해 생성된다고 가정하고, 경험적 최대우도 추정이 샘플 복잡도 O(m/ε²)와 다항시간에 가능함이 알려져 있다. 그러나 실제 데이터는 악의적인 오염(ε‑fraction corruption)으로 인해 이러한 가정이 깨지며, 기존 알고리즘은 작은 오염에도 성능이 급격히 저하된다. ### 문제 정의 및 가정 - **오염 모델**: ε < ½ 인 경우, 전체 N개의 샘플 중 ε·N개를 적대적 공격자가 자유롭게 교체한다(삭제·삽입 모두 허용). - **구조 고정**: 그래프 G는 사전에 알려져 있다. - **조건부 확률표 균형성**: 모든 CPT 엔트리 p_{i,a} ∈

강인한 고정구조 베이즈 네트워크 학습

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기