그룹 이론 기반 부분 행렬 곱셈으로 매트릭스 곱셈 지수 개선
초록
본 논문은 Cohn‑Umans의 그룹 이론적 전체 행렬 곱셈을 일반화하여, 삼중곱셈 성질을 완전히 만족하지 않는 부분 행렬 곱셈(별칭 현상)을 허용하는 프레임워크를 제시한다. 부분 곱셈에서 발생하는 별칭을 제어하기 위한 “커버” 문제를 정의하고, 이 문제가 NP‑hard임을 증명한다. 최적 커버를 찾는 지수 시간 알고리즘과, 최소 정점 커버에 기반한 다항 시간 근사 알고리즘을 제시한다. 또한, 별칭을 허용하면서도 추가적인 행·열을 포함시켜 기존 Cohn‑Umans 구성보다 더 큰 정보량 f(A)를 얻어, 특정 경우에 ω의 상한을 기존 기록(ω ≤ 2.9088)보다 약간 낮은 2.9084로 개선한다.
상세 분석
이 논문은 Cohn‑Umans가 제시한 “그룹 대수에 행렬을 임베딩하고 푸리에 변환을 이용해 컨볼루션을 수행한다”는 아이디어를 출발점으로 삼는다. 기존 이론에서는 세 집합 S, T, U가 삼중곱셈 성질(triple product property, TPP)을 만족해야만 전체 n × n 행렬 곱셈을 정확히 재현할 수 있었다. 저자들은 TPP를 완화하고, 일부 곱셈 항이 잘못 섞이는 현상(별칭, aliasing)을 허용한다. 별칭이 발생하면 해당 항이 잘못된 위치에 더해지지만, 입력 행렬의 특정 원소를 0으로 만들면 잘못된 항을 억제할 수 있다. 이를 위해 “별칭 삼중항” A를 정의하고, A를 커버하는 인덱스 집합 I, J를 찾는 문제를 공식화한다. I와 J는 각각 왼쪽·오른쪽 입력 행렬에서 0으로 만들 원소들의 위치를 의미한다.
핵심은 함수 f(I, J) = ∑ₖ kₖ·nₖ 로, kₖ는 I에 포함되지 않은 왼쪽 행렬의 k번째 열의 비제로 원소 수, nₖ는 J에 포함되지 않은 오른쪽 행렬의 k번째 행의 비제로 원소 수를 나타낸다. f(A)는 모든 가능한 커버 중 f(I, J)의 최댓값이며, 이는 부분 곱셈이 실제로 수행하는 연산량을 정량화한다. f(A)가 클수록 더 많은 “정보”를 계산하므로, ω에 대한 상한인 ω ≤ 3·log(∏d_i)·log f(A) 가 더 강해진다.
저자들은 f(A) 최적화를 위한 두 알고리즘을 제시한다. 첫 번째는 별칭 삼중항을 이분 그래프의 간선으로 보고 최소 정점 커버를 찾는 전통적인 König 정리를 이용한 다항 시간 알고리즘이다. 이 알고리즘은 f를 최소화하는 것이 아니라, 0으로 만들어야 할 원소 수를 최소화한다는 점에서 “좋은” 커버를 빠르게 제공한다. 두 번째는 완전 탐색 기반의 지수 시간 알고리즘으로, 각 별칭 삼중항을 왼쪽 또는 오른쪽에서 0으로 만들 선택을 재귀적으로 탐색하면서 현재까지 얻은 최적값보다 작아지면 가지치기를 수행한다. 이 과정은 NP‑hard임을 증명함으로써, 일반적인 경우에 효율적인 정확 해를 기대하기 어렵다는 이론적 한계를 명확히 한다.
구체적인 적용 사례로, 저자들은 Cohn‑Umans와 Cohn‑et al.이 사용한 H = C_n × C_n × C_n, G = H ⋊ S_2 구조를 재검토한다. 기존 구성에서는 S, T, U가 각각 2n(n‑1)개의 원소를 갖고 TPP를 만족해 f = |S||T||U| = 8n³(n‑1)³ 이다. 여기서 각 집합에 항등원 (e_H, e_H) 를 추가해 S₀, T₀, U₀ 로 확장하면 별칭이 발생하지만, 별칭을 커버하기 위해 추가된 행·열의 원소만을 0으로 만들면 전체 연산량 f(A) 가 기존보다 크게 증가한다. 저자들은 이를 정량화하여 f(A) ≥ (2n(n‑1))³ + (2n(n‑1))² + 2n(n‑1) − (n‑1)² + 1 로 계산하고, n = 17일 때 ω ≤ 2.9084 를 얻는다. 이는 기존 기록 ω ≤ 2.9088 보다 미세하지만 확실히 개선된 결과이며, 부분 행렬 곱셈을 통한 “정보량 증가” 전략이 실제로 지수 개선에 기여할 수 있음을 보여준다.
전체적으로 이 논문은 그룹 이론적 행렬 곱셈에 부분 곱셈과 별칭 커버라는 새로운 차원을 도입함으로써, 기존 TPP 기반 접근법의 제한을 넘어서는 가능성을 제시한다. NP‑hard성 증명과 실용적인 다항 시간 커버 알고리즘 제공은 이론적 깊이와 실용성을 동시에 갖추고 있으며, 향후 더 큰 그룹이나 복합 구조에 적용해 ω = 2에 한 걸음 더 다가갈 수 있는 연구 방향을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기