효율적인 워들 전략을 위한 간단 휴리스틱
초록
본 논문은 워들(Wordle) 게임에서 매일 바뀌는 정답 리스트에 대해, 복잡한 전역 최적화 대신 단순히 가능한 정답 단어만을 후보로 삼는 여러 휴리스틱을 적용함으로써 초당 수준의 계산 속도로 평균 3.5회 이하의 추측으로 정답을 찾는 실용적인 전략을 제시한다. 특히 “bin 수 최대화”와 “기대 bin 크기 최소화”를 결합한 방법이 가장 우수했으며, 하드 모드와 슈퍼하드 모드에서도 비교적 좋은 성능을 보인다.
상세 분석
워들은 5글자 영단어를 6번 안에 맞추는 퍼즐형 게임으로, 정답 후보군은 초기 2,315개에서 현재는 3,158개로 확대되었다. 기존 연구들은 전체 후보와 추측 가능한 단어(≈12,000개)를 모두 활용해 L‑∞(최대 bin 크기) 혹은 엔트로피 기반 최적화를 수행했으며, “salet”, “tarse”, “soare” 같은 익숙하지 않은 시작 단어를 제안했다. 그러나 이러한 전역 최적화는 계산량이 방대해 매일 업데이트되는 정답 리스트에 적용하기 어렵다.
본 논문은 두 가지 핵심 가정을 둔다. 첫째, 매일 새로운 정답이 등장하고 재사용되지 않으므로 과거 사용 단어를 제외하고 매일 재계산 가능한 휴리스틱이 필요하다. 둘째, 추측 단어를 가능한 정답 집합에만 제한해도 충분히 좋은 성능을 얻을 수 있다.
연구자는 후보 단어를 “bin”이라는 색상 응답 패턴별 그룹으로 나누고, 각 후보에 대해 다음과 같은 정량적 지표를 계산한다.
- negnumbins – bin 수의 부정값(즉, bin 수 최대화). 이는 L₀ 노름에 해당한다.
- negnumentropy – 엔트로피의 부정값(엔트로피 최대화). L₁ 노름 미분 형태.
- expbinsize – 기대 bin 크기(즉, L₂ 노름 최소화).
- Linfinity – 최대 bin 크기와 그 빈도(복합 L∞).
- negnumsingletons – 크기 1인 bin 수의 부정값(L₋∞).
- maxsimilarity, maxbinsize, maxonediffs 등 – bin 내부 단어 간 유사도 혹은 한 글자 차이 등을 최소화하는 보조 지표.
실험에서는 2,315개와 3,158개 두 후보 집합에 대해 위 지표들을 각각 적용했으며, 평균 추측 횟수와 최악 경우(최대 추측 횟수)를 비교했다. 결과는 다음과 같다.
- negnumbins(시작 단어 “trace”)가 평균 3.4600(2,315)·3.6089(3,158)으로 가장 낮았다.
- expbinsize와 Linfinity는 평균 3.52~3.56 사이로 뒤를 이었다.
- 엔트로피 기반 negnumentropy는 평균 3.4955~3.6431로, 기대 bin 크기 최소화보다 약간 뒤졌다.
특히 “negnumbins‑expbinsize” 조합(주 휴리스틱: bin 수 최대화, 보조: 기대 bin 크기 최소화)은 평균 3.4553(2,315)·3.6058(3,158)으로 최적에 근접했으며, 최대 추측 횟수는 6~7회에 머물렀다.
하드 모드와 슈퍼하드 모드에서는 단순히 bin 수만을 고려하면 성능이 급격히 저하된다. 여기서는 maxonediffs, maxsimilarity와 같은 보조 지표를 결합해 “negnumbins‑maxonediffs” 혹은 “negnumbins‑similarity” 조합을 사용했으며, 평균 추측 횟수는 3.533.73 정도였지만 최악 경우가 89회로 늘어났다. 이는 하드 모드에서 정보 손실을 보완하기 위해 bin 내부 구조까지 고려해야 함을 시사한다.
또한 과거에 사용된 정답을 제외하고 매일 재계산한 결과, 전체 평균 추측 횟수는 3.4905(전체 3,158)로 크게 변동이 없으며, 최대 6회가 필요한 경우는 9개 단어에 국한된다. 사용된 단어를 추측 후보에서도 제외하면 평균 3.5030, 최대 6회가 7개 단어에만 발생한다.
마지막으로, 코드와 일일 전략을 제공하는 웹사이트(http://rig.cs.luc.edu/~rig/wordle)를 공개함으로써 실용성을 높였다.
핵심 인사이트는 다음과 같다.
- bin 수 최대화가 가장 강력한 기본 휴리스틱이며, 이는 후보를 가능한 한 많이 분할해 정보량을 극대화한다는 직관과 일치한다.
- 엔트로피 최대화는 이론적으로는 타당하지만, 실제 평균 추측 횟수에서는 미세하게 뒤진다. 이는 엔트로피가 큰 bin을 몇 개 만들더라도 작은 bin이 많이 남을 경우 평균 성능이 저하될 수 있기 때문이다.
- 하드 모드에서는 단순 bin 수 외에 단어 간 차이(maxonediffs)와 유사도(maxsimilarity)를 고려한 복합 휴리스틱이 필요하다.
- 후보를 가능한 정답 집합에만 제한해도 충분히 좋은 성능을 얻을 수 있어, 인간 플레이어가 익숙한 단어만 사용하면서도 효율적인 전략을 구현할 수 있다.
이러한 결과는 워들 전략 연구에 있어 “전역 최적화”보다 “빠른 근사”가 실용적인 상황에서 더 유용함을 보여준다.
댓글 및 학술 토론
Loading comments...
의견 남기기