두 층 커널 머신과 다중 커널 학습

본 논문은 두 층 구조를 갖는 커널 머신을 제안하고, 이를 통해 기존 단일층 커널 방법을 일반화한다. 두 층 네트워크에 대한 대표성 정리를 증명하여 각 층에서 유한 개의 커널 선형 결합만이 최적임을 보였으며, 이 구조가 학습 가능한 단일 커널을 갖는 단일층 머신과 동등함을 밝혀냈다. 또한 다중 커널 학습(MKL)이 두 층 커널 머신의 특수 경우임을 보여주고, 정규화 최소제곱(RLS) 기반의 두 층 모델인 RLS2 알고리즘을 제안한다. 실험과 M…

저자: Francesco Dinuzzo

본 논문은 커널 기반 학습 모델을 두 층 구조로 확장함으로써 기존의 단일층 커널 방법을 일반화하고, 다중 커널 학습(MKL)과의 관계를 명확히 규정한다. 1. **연구 배경 및 동기** 전통적인 커널 머신은 입력 공간과 출력 공간 사이에 하나의 비선형 매핑을 가정하고, 이 매핑을 RKHS의 원소로 표현한다. 그러나 실제 문제에서는 여러 단계의 비선형 변환이 필요할 수 있으며, 동시에 최적의 커널 형태를 데이터로부터 학습하고자 하는 요구가 있다. 이러한 요구를 충족시키기 위해 저자들은 “두 층 커널 머신(two‑layer kernel machines)”이라는 새로운 프레임워크를 도입한다. 2. **수학적 정의** 입력 x∈X를 중간 표현 z=h(x)∈Z 로 매핑하는 첫 번째 층 h와, 중간 표현을 최종 출력 y=g(z)∈Y 로 매핑하는 두 번째 층 g를 각각 RKHS H₁, H₂에 정의한다. 각각의 RKHS는 커널 K₁, K₂를 갖으며, 손실 함수 L(y, g∘h(x))와 정규화 항 Ω₁(‖h‖_{H₁})+Ω₂(‖g‖_{H₂})를 포함하는 정규화 위험 최소화 문제를 설정한다. 3. **두 층 구조에 대한 대표성 정리** 핵심 이론적 기여는 두 층 네트워크에 대한 대표성 정리이다. 저자들은 변분 문제의 최적 해 (h*, g*)가 각각의 RKHS에서 훈련 샘플 {x_i}_{i=1}^N에 대한 커널 평가의 유한 선형 결합으로 표현될 수 있음을 증명한다. 구체적으로, \

두 층 커널 머신과 다중 커널 학습

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기