탭PFN 기반 여행 판매원 문제 해결

탭PFN 기반 여행 판매원 문제 해결
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 작은·중간 규모 표형 데이터에 특화된 기반 모델 TabPFN을 여행 판매원 문제(TSP)에 적용한다. 노드 기반 접근과 노드 예측 적응 전략을 통해 전체 경로를 한 번에 생성하고, 단일 샘플만으로도 빠른 적응·미세조정을 수행한다. 실험 결과, 다양한 인스턴스 크기에서 최소 학습 시간과 높은 일반화 성능을 보이며, 후처리 없이도 경쟁력 있는 해 품질을 달성한다는 점을 확인하였다.

상세 분석

TabPFN은 사전 학습된 베이지안 신경망을 활용해 작은 표형 데이터셋에 대해 몇 초 안에 정확한 예측을 제공하도록 설계된 모델이다. 기존 조합 최적화 분야에서는 대규모 그래프 신경망이나 강화학습 기반 메타휴리스틱이 주류를 이루었으며, 이들 방법은 수백만 개의 훈련 샘플과 수시간 이상의 GPU 연산을 필요로 한다. 논문은 이러한 고비용을 회피하기 위해 TabPFN을 “노드 기반” TSP 해결에 재구성한다. 구체적으로, 각 도시를 하나의 레코드로 취급하고, 현재까지 방문한 순서와 남은 도시 집합을 입력 피처로 구성한다. TabPFN은 이 입력을 받아 다음에 방문할 최적의 도시를 확률적으로 예측하고, 이를 순차적으로 반복해 전체 순회를 완성한다. 핵심 적응 단계는 두 가지로 나뉜다. 첫째, 사전 학습된 TabPFN 파라미터를 고정하고, TSP 특성에 맞는 입력 포맷만 변환한다(“입력 적응”). 둘째, 단일 TSP 인스턴스(또는 매우 적은 수)의 최적 경로를 정답 레이블로 사용해 모델을 몇 번의 에폭만큼 미세조정한다(“미세조정”). 이 과정은 CPU 환경에서도 5~10분 이내에 완료된다. 실험에서는 20, 50, 100 도시 규모의 인스턴스를 무작위로 1,000개씩 생성해 훈련·검증·테스트를 수행했으며, 평균 최적도 비율(Optimality Gap)과 실행 시간을 주요 지표로 삼았다. 결과는 기존 GNN‑based 메타휴리스틱이나 전통적 휴리스틱(2‑opt, Lin‑Kernighan) 대비 학습 비용은 현저히 낮지만, 최적도 비율은 2‑3% 수준에서 차이가 나는 정도로 경쟁력을 유지한다는 점을 보여준다. 특히, 모델이 한 번의 샘플에만 적응했음에도 불구하고, 훈련되지 않은 크기의 인스턴스(예: 150도시)에서도 성능 저하가 완만하게 나타나 일반화 능력이 뛰어남을 확인했다. 이러한 특성은 제한된 연산 자원과 빠른 배포가 요구되는 실시간 물류·라우팅 시스템에 직접 적용 가능함을 시사한다.


댓글 및 학술 토론

Loading comments...

의견 남기기