빅데이터로 보는 대칭군 카잔‑루시갸 다항식의 숨은 규칙
초록
본 논문은 대칭군 Sₙ ( n ≤ 11 )에 대한 카잔‑루시갸(KL) 다항식을 전산적으로 모두 계산하고, 데이터 과학 기법—탐색적 데이터 분석(EDA)과 위상 데이터 분석(TDA)—을 적용해 분포, 극값, 구조적 특성을 정량화한다. 주요 발견은 대부분의 KL 다항식이 0이지만, 비제로인 경우는 거의 모두 서로 다른 형태를 보이며, 계수는 초지수적으로 성장하고, 다항식은 거의 전부 단봉형(unimodal)이며, 근은 프리드리히‑포트리어(PF) 성질을 거의 만족한다는 점이다.
상세 분석
논문은 먼저 Sₙ ( n = 1 ~ 11 )에서 모든 순열 쌍 ( v,w )에 대해 KL 다항식 P_{v,w}(q) 를 계산하고, 이를 “하나의 순열을 고정(보통 항등원)한 경우”와 전체 경우로 나누어 데이터베이스를 구축한다. 계산량은 (n!)²에 달해 S₁₁에서는 약 60일의 연산 시간이 소요됐으며, S₁₃까지 확장하려면 수백 일 이상이 필요함을 언급한다.
데이터 분석은 크게 네 부분으로 전개된다.
- 밀도(Density): 섹션 4와 5에서 비제로 다항식의 비율과 서로 다른 비제로 다항식의 비율을 조사한다. 전체 경우에는 0이 차지하는 비율이 90 % 이상으로 매우 높지만, 고정된 항등원 경우에는 비제로 다항식이 거의 전부 서로 다른 형태를 보여 “거의 전부 비제로이면서 서로 다르다”는 역설적 현상이 발견된다.
- 극값(Extremes): 섹션 6에서는 최고 차수와 q=1에서의 평가값이 n에 대해 초지수적으로 증가한다는 경험적 추정을 제시한다. n=13에서 계수가 8자리까지 도달한 사례가 제시되며, 이는 기존의 Pol99 알고리즘이 보장하는 선형 성장보다 훨씬 빠른 성장률을 시사한다.
- 구조(Structure): 섹션 7~11에서는 다항식의 계수 배열, 근의 분포, PF 성질 등을 다룬다.
- 단봉성(Unimodality): 거의 모든 KL 다항식이 한 개의 피크를 가지며, 다중 피크(두 개, 세 개) 다항식은 n이 커질수록 비율이 급격히 감소한다.
- 근(Roots): 복소근은 실근 비율이 약 24 %이며, 실근 중 절댓값이 1에 가까운 근이 44 % 정도 존재한다. 또한 PF 성질(가장 큰 실근이 양수이고 다른 모든 실근이 그보다 작다)을 만족하지 않는 경우는 매우 드물다.
- KL Ballmapper: 고차원 매핑 기법을 이용해 다항식들을 클러스터링하고, 특정 “핵심” 영역이 존재함을 시각화한다.
- 예측과 추측: 위 관찰을 바탕으로 “KL 다항식은 고정된 n에 대해 매우 편향된 분포를 가진다”, “극대 계수는 n에 대해 초지수적으로 성장한다”, “대부분이 단봉이며 PF 성질을 만족한다”는 일련의 정량적 추측을 제시하고, 증명 전략으로는 대칭군의 셀 구조와 KLR 대수의 그레이딩을 활용한 조합적 접근을 제안한다.
방법론적으로는 히트맵, 로그 스케일 플롯, 선형 회귀를 통한 성장률 추정, 그리고 TDA에서 사용되는 Ballmapper 알고리즘을 적용했다. 데이터와 코드, 고해상도 그림은 온라인 저장소에 공개되어 재현성을 확보한다.
한계점으로는 n ≥ 12에서의 계산 비용 급증, 메모리 제한, 그리고 현재는 실험적 관찰에 기반한 추측이 많아 엄밀한 증명이 부족함을 인정한다. 향후 연구 방향으로는 다른 유형(Coxeter 그룹), 안티스페리컬 KL 다항식, KLR 대수와 그레이드 표현론, 그리고 텐서 카테고리와 양자 결절 이론 등으로 확장할 가능성을 제시한다.
전반적으로 이 논문은 전통적인 조합론·기하학적 접근이 놓치기 쉬운 “통계적” 패턴을 빅데이터와 위상적 시각화 기법으로 드러내며, KL 다항식 연구에 새로운 실험적 기반을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기