괄호 유무에 따른 산술식 구성 문제의 복잡도 분석
초록
본 논문은 주어진 연산자 집합과 입력값(멀티셋)으로 목표값을 만들 수 있는 산술 표현식 트리의 존재 여부를 묻는 문제를, 트리 구조가 고정된 경우(괄호 강제)와 괄호 없이 연산 순서만 표준 연산자 우선순위를 따르는 경우(괄호 없음)로 나누어 조사한다. 연산자 조합별로 NP‑완전성(강/약) 여부를 정리한 표를 제시하고, 제품 분할, 3‑분할 등 전통적인 NP‑완전 문제들로부터 다항식 시간 감소를 구성한다. 결과적으로 대부분의 연산자 조합이 약한 NP‑완전임을 보이며, {×,÷}와 같은 경우는 강한 NP‑완전성을 갖는다.
상세 분석
논문은 먼저 기존 연구인 “Arithmetic Expression Construction (AEC)” 문제를 재정의한다. AEC‑Std는 연산자 집합 ops와 입력값 멀티셋 A, 목표값 t가 주어졌을 때, 각 입력값을 정확히 한 번씩 사용하고 연산자도 자유롭게 선택해 괄호가 포함된 식을 만들 수 있는지를 묻는다. 저자는 여기서 두 가지 변형을 추가한다. 첫 번째는 Enforced Parenthesis (AEC‑EP) 로, 목표 식의 트리 구조 D가 미리 주어져 식이 그 구조와 동형이어야 한다는 제약을 둔다. 두 번째는 No Parenthesis (AEC‑NP) 로, 괄호를 전혀 사용하지 못하고 연산자는 전통적인 연산자 우선순위(곱·나눗셈 → 덧·뺄셈)만을 따른다.
연산자 집합에 따라 문제의 난이도가 달라짐을 체계적으로 조사한다. 표 1은 16가지 연산자 조합에 대해 AEC‑EP와 AEC‑NP 두 변형 모두에 대한 복잡도 결과를 정리한다. 주요 관찰은 다음과 같다.
- 단일 연산자 {+}, {×}는 두 변형 모두 P에 속한다. 이는 연산이 전부 같은 종류이므로 목표값을 만들기 위해서는 단순히 합산 혹은 곱셈을 수행하면 되며, 이는 다항식 시간에 검증·구성이 가능하기 때문이다.
- **단일 뺄셈 {−}**은 AEC‑NP에서는 P이지만 AEC‑EP에서는 약한 NP‑complete(weakly NP‑complete)이다. 괄호가 강제되면 부호 배정을 결정해야 하는데, 이는 부분합 문제와 동등하게 어려워진다.
- **단일 나눗셈 {÷}**은 두 변형 모두 강한 NP‑complete(strongly NP‑complete)이다. 나눗셈은 정수 나눗셈에서 나머지를 고려해야 하므로, 인스턴스 크기에 비례하지 않는 큰 수를 생성할 수 있어 강한 난이도가 발생한다.
- 두 연산자 조합 중 {+,−}, {+,×}, {+,÷}, {−,×}, {−,÷} 등은 모두 약한 NP‑complete이며, {×,÷}만이 강한 NP‑complete를 유지한다. 이는 곱·나눗셈이 동시에 존재할 때 인스턴스 크기와 무관하게 큰 지수적 값을 만들 수 있기 때문이다.
- 세 연산자 이상 조합도 모두 약한 NP‑complete이며, 특히 {+,−,×,÷} 전체 집합도 동일한 난이도를 보인다.
복잡도 증명은 대부분 Rational Function Framework(Leo et al., 2020) 를 활용한다. 이 프레임워크는 정수 인스턴스를 다항식(또는 유리함수) 형태로 변환해, 연산자 집합에 따라 생성 가능한 다항식의 차수와 계수를 분석한다. 저자는 이 방법을 이용해 제품 분할(product partition‑n/2), 3‑분할(3‑partition), 제품 분할‑강화(product partition‑n/2 with division) 등 전형적인 NP‑완전 문제들로부터 다항식 시간 감소를 설계한다.
예를 들어, {+,÷,∗} 조합에 대해 AEC‑NP가 약한 NP‑hard임을 보이기 위해, 제품 분할‑n/2 인스턴스를 다음과 같이 변환한다. 입력값 a_i를 각각 a_i·x 형태의 다항식으로 바꾸고, 추가적인 보조 변수 y^k 를 삽입해 목표값 t = 2·x^{n/2}·∏a_i 로 만든다. 이때 연산 순서는 곱·나눗셈이 먼저 수행되고 마지막에 하나의 덧셈만 허용되므로, 원래 제품 분할 문제와 1:1 대응이 성립한다.
또한, 괄호가 강제된 경우에도 동일한 변환이 그대로 적용될 수 있음을 보이며, 따라서 AEC‑EP와 AEC‑NP 사이에 복잡도 차이가 없음을 증명한다. 다만, {−,∗}와 같이 뺄셈이 포함된 경우는 부호 배정이 추가적인 자유도를 제공하므로, 약한 NP‑hardness만을 얻는다.
마지막으로, 논문은 강한 vs 약한 NP‑completeness 구분에 대해 논의한다. 강한 NP‑completeness은 입력값이 유니코드(바이너리) 크기에 비해 다항식 시간에 해결 불가능함을 의미하는데, 이는 특히 나눗셈 연산이 포함된 경우에 나타난다. 반면, 약한 NP‑completeness은 입력값이 유니코드 크기에 따라 다항식 시간에 해결 가능할 수도 있음을 시사한다(예: 부분합 형태).
전체적으로 이 논문은 산술식 구성 문제의 복잡도 지형을 연산자 조합별로 세밀히 구분하고, 기존의 AEC 연구를 확장해 괄호 제약과 연산자 우선순위 제한을 동시에 고려한 새로운 NP‑완전성 결과를 제공한다. 이는 자동 수학 문제 풀이, 기계 학습 기반 식 생성, 그리고 교육용 퍼즐 설계 등에 이론적 기반을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기