도메인 재귀로 확장된 첫 번째 차원 확률 추론

본 논문은 통계적 관계 학습(Statistical Relational Learning, SRL) 분야에서 확률적 추론을 효율적으로 수행하기 위한 새로운 이론적 기반을 제시한다. SRL 모델은 객체와 그 관계를 논리식으로 기술하면서 확률적 가중치를 부여하지만, 이러한 모델을 직접 그래프 형태로 전개하면 수백만 개의 랜덤 변수와 복잡한 연결 구조가 발생해 계산이 불가능해진다. 이를 해결하기 위해 ‘lifted inference’라는 접근법이 도입되었으며, 이는 동일한 정보를 가진 객체들을 구분하지 않고 집합적으로 다루어 도메인 규모에 대한 선형(다항) 시간 복잡도를 목표로 한다. ### 1. 배경 및 기존 연구 Lifted inference는 여러 규칙(분해, 케이스 분석, 유닛 전파, 캐싱 등)을 조합해 WFOMC(weighted first‑order model counting) 문제를 해결한다. 기존에 알려진 도메인‑리프트 가능한 클래스는 FO²(두 개 이하의 논리 변수만 포함)와 recursively‑unary(RU) 두 가지이며, 각각은 특정 형태의 절에 대해 다항 시간 알고리즘을 보장한다. 그러나 이들 클래스는 실제 모델링 요구를 충분히 포괄하지 못한다. 특히 Beame 등(2013)이 제시한 S4 절, 대칭 전이성 관계, 그리고 생일 역설과 같은 문제는 기존 규칙만으로는 효율적인 추론이 불가능했다. ### 2. 도메인 재귀 규칙(Domain Recursion) 도메인 재귀는 전체 도메인 ∆를 하나의 원소 A와 나머지 ∆₀로 분리하고, A를 명시적으로 다룬 뒤 기존 규칙을 적용해 ∆₀에 대한 동일한 문제로 환원한다. 이 과정은 다음과 같이 진행된다. 1. **도메인 분할**: ∆ = ∆₀ ∪ {A}. 2. **규칙 적용**: 기존 R(분해, 케이스 분석 등) 규칙을 적용해 A와 관련된 절을 단순화한다. 3. **동적 프로그래밍**: ∆₀에 대한 WFOMC 값을 캐시하고, 재귀적으로 계산한다. 이러한 절차는 도메인 크기 n에 대해 O(n) 단계만 필요하므로, 도메인‑리프트 가능성을 확보한다. ### 3. 주요 정리 및 증명 - **Proposition 1 (S4 절)**: 네 개의 이진 PRV가 포함된 S4 절은 R_D(기존 규칙 + 도메인 재귀)로 다항 시간에 계산 가능함을 증명한다. 기존 R만으로는 불가능했으며, 도메인 재귀가 핵심적인 역할을 한다. - **Proposition 2 (대칭 전이성)**: 대칭 전이성 관계(¬F(x,y) ∨ ¬F(y,z) ∨ F(x,z) 와 ¬F(x,y) ∨ F(y,x) 로 구성) 역시 R_D를 사용하면 도메인‑리프트 가능함을 보인다. 모델 수는 Bell 수와 동일하지만, 기존 알고리즘은 이를 효율적으로 셀 수 없었다. - **Proposition 3 (생일 역설)**: 사람 집합 ∆ₚ와 날짜 집합 ∆_d에 대한 Born(p,d) 관계를 표현한 논리식 역시 R_D를 적용하면 다항 시간에 WFOMC를 구할 수 있다. 이는 확률적 계산을 직접적인 샘플링 없이 정확히 수행할 수 있음을 의미한다. ### 4. 새로운 Liftable 클래스 도메인 재귀를 활용해 두 개의 확장된 클래스가 정의된다. - **S²FO²**: 모든 절이 FO² 형태를 만족하면서도, 도메인 재귀에 의해 추가적인 구조적 제한이 허용된 클래스. 이는 FO²를 엄격히 포함한다. - **S²RU**: recursively‑unary 이론에 도메인 재귀를 적용한 확장 클래스. RU보다 넓은 모델을 포괄하며, 여전히 도메인‑리프트 가능성을 유지한다. 두 클래스는 각각 **선형성(linearity)**(멤버십 검사 O(|T|))과 **도메인 크기 독립성**(멤버십 검사에 도메인 크기 영향 없음)이라는 속성을 분석한다. FO²는 선형이지만 표현력이 제한적이며, RU는 도메인 크기와 무관하지만 멤버십 검사가 지수적일 수 있다. S²FO²와 S²RU는 이러한 트레이드오프를 완화한다. ### 5. 알고리즘적 구현 및 실험적 관찰 논문은 WFOMC 계산을 위한 구체적인 절차를 제시한다. 핵심 단계는 다음과 같다. 1. **Lifted Decomposition**: 도메인 내 개별 객체가 동일하게 행동한다는 점을 이용해 한 객체에 대한 서브문제만 계산하고, 결과를 도메인 크기만큼 거듭제곱한다. 2. **Lifted Case‑Analysis**: 하나의 논리 변수에 대해 가능한 ‘참인 개수’를 파라미터화해 경우의 수를 |∆|+1 로 축소한다. 3. **Shattering**: 케이스 분석 후 서로 다른 서브도메인(예: 참인 집합과 거짓인 집합)으로 나뉘어 교환 가능성이 깨지면 절을 분리한다. 4. **Unit Propagation & Caching**: 단위 절을 이용해 남은 절을 간소화하고, 동일 서브문제에 대한 결과를 캐시한다. 5. **Domain Recursion**: 위 과정이 더 이상 적용되지 않을 때, 도메인 재귀를 수행해 문제를 크기가 1 감소한 동일 형태의 서브문제로 변환한다. 이러한 파이프라인을 통해 S4, 대칭 전이성, 생일 역설 등 기존에 비효율적이던 모델을 다항 시간에 정확히 해결한다. ### 6. 의의 및 향후 연구 본 연구는 도메인 재귀가 단순히 이론적 흥미를 넘어 실제 SRL 시스템에서 확장 가능한 추론 엔진을 설계하는 핵심 메커니즘임을 입증한다. 새로운 클래스 S²FO²와 S²RU는 기존 liftable 클래스보다 넓은 모델링 범위를 제공하면서도, 도메인‑리프트 가능성을 유지한다. 앞으로는 (1) 도메인 재귀와 근사 추론 기법의 결합, (2) 자동 클래스 식별 및 멤버십 검사 최적화, (3) 대규모 실세계 데이터셋에 대한 실험적 검증 등이 연구 과제로 남아 있다. ---

도메인 재귀로 확장된 첫 번째 차원 확률 추론

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기