마스터마인드 문제를 위한 전면 탐색 전략의 새로운 접근

초록

본 논문은 마스터마인드 퍼즐의 전면 탐색 알고리즘을 재검토하고, 후보군에 실제 해가 포함되는지 여부가 성능에 미치는 영향을 분석한다. 이를 기반으로 기존 휴리스틱보다 후보 해의 점수 순위에 중점을 둔 새로운 탐색 방식을 제안한다.

상세 요약

마스터마인드 퍼즐은 비밀 코드(시크릿)를 찾기 위해 일련의 추측 문자열을 제시하고, 각 추측에 대해 색(흑·백) 혹은 위치·색 일치 정도를 피드백으로 받는 전형적인 검색 문제이다. 이 문제는 가능한 코드 공간이 알파벳 크기와 코드 길이에 따라 기하급수적으로 증가하므로, 완전 탐색이라도 효율적인 후보 선택이 필수적이다. 기존 연구에서는 “다음 단계에서 검색 공간을 가장 크게 감소시킬 후보”를 선택하기 위해 엔트로피, 최소 최대군 크기, 평균 정보 이득 등 다양한 경험적 점수를 사용하였다. 이러한 점수는 주로 후보군 전체의 분포를 고려하지만, 실제 정답이 후보군 중 어느 위치에 있는지는 무시한다는 한계가 있다.

저자들은 이 점을 지적하며, “정답이 후보군에 존재하고, 그 정답이 가장 높은 점수를 받는가”라는 두 번째 요인이 알고리즘 성공에 결정적인 역할을 할 수 있음을 실험적으로 증명한다. 구체적으로, 후보군을 점수 순으로 정렬했을 때 정답이 최상위에 위치하는 비율을 측정하고, 이 비율이 높을수록 전체 게임 라운드 수가 감소한다는 상관관계를 발견하였다. 이는 점수 함수 자체가 정답을 올바르게 “예측”하도록 설계되어야 함을 의미한다.

이를 토대로 저자들은 기존 점수 함수에 정답 포함 여부를 반영하는 보정 항을 추가하거나, 점수 순위 자체를 정답 후보군 우선순위로 재구성하는 두 가지 새로운 전면 탐색 전략을 제안한다. 첫 번째는 “정답 포함 보정(Answer‑Presence Adjustment)”으로, 후보군 내에 가능한 정답이 몇 개 남아 있는지를 가중치로 적용한다. 두 번째는 “최고 점수 정답 우선(Top‑Score Answer First)” 방식으로, 점수 계산 후 정답 후보군이 최상위에 오도록 순위를 재조정한다.

실험에서는 표준 4‑peg, 6‑color 설정과 확장된 5‑peg, 8‑color 설정을 대상으로 기존 Knuth, Minimax, Entropy 기반 알고리즘과 비교하였다. 결과는 새로운 방법이 평균 라운드 수에서 기존 방법과 동등하거나 약간 우수했으며, 특히 라운드 수 분산이 감소하고 최악 경우 시나리오에서의 성능이 크게 개선되었음을 보여준다. 또한, 후보군 크기 감소율과 정답 포함 비율이 동시에 향상되는 현상이 관찰되었다.

이러한 발견은 전면 탐색이 비록 계산 비용이 크더라도, 정답 후보군의 “위치” 정보를 활용하면 비전통적 휴리스틱보다 더 견고한 성능을 얻을 수 있음을 시사한다. 특히, 진화 알고리즘이나 Monte‑Carlo 트리 탐색과 같은 비전형적 탐색 기법에 초기 해집합을 제공할 때, 정답 포함 보정이 적용된 후보군을 사용하면 탐색 공간을 보다 효율적으로 축소시킬 수 있다.

결론적으로, 마스터마인드와 유사한 조합 최적화 문제에서 “정답이 후보군에 존재하는가”라는 이진 정보를 점수 함수에 통합하는 것이, 순수히 정보량 감소만을 목표로 하는 기존 휴리스틱보다 실용적인 이점을 제공한다는 점을 저자들은 실험적으로 입증하였다.

초록

상세 요약

📜 논문 원문 (영문)