초음파처럼 탐색하고 검증하는 시계열 자연어 질의 프레임워크 SonarTS
초록
SonarTS는 대규모 시계열 데이터베이스에서 사용자가 자연어로 제시한 복합적인 형태·이상 탐지 질의를 처리하기 위해 “검색‑후‑검증” 파이프라인을 도입한 신경‑심볼릭 시스템이다. 다중 스케일 특징 인덱스를 활용해 후보 윈도우를 빠르게 찾고, 생성된 파이썬 프로그램으로 원시 신호를 검증한다. 이를 평가하기 위해 NLQTSBench라는 대규모 벤치마크가 새롭게 제시되었다.
상세 분석
SonarTS는 기존 Text‑to‑SQL과 시계열 질문응답(TSQA) 모델이 각각 갖는 한계를 동시에 극복하도록 설계되었다. 첫 번째 한계는 SQL이 연속적인 형태(예: 급상승·완만한 하강)와 같은 모핑적 의도를 표현할 수 없다는 점이다. 두 번째는 최신 시계열 LLM이 수백~수천 포인트 정도의 고정 컨텍스트 윈도우만 처리할 수 있어, 수십만 포인트에 달하는 실제 TSDB의 초장기 히스토리를 직접 읽어들이기 어렵다는 점이다. SonarTS는 이러한 문제를 “검색‑후‑검증”이라는 두 단계로 분리한다.
검색 단계에서는 오프라인에서 미리 구축한 다중 스케일 특징 테이블(예: SAX, 통계 프리미티브, 형태 서명)을 활용해 SQL 질의만으로 후보 윈도우를 고속으로 추출한다. 이때 사용되는 인덱스는 윈도우‑레벨 메타데이터와 통계값, 그리고 형태 기반 시그니처를 포함하므로, 형태‑지향 질의(예: “V‑shape 패턴”)를 높은 리콜로 필터링할 수 있다.
검증 단계에서는 대형 언어 모델(LLM)이 자연어 질의를 기반으로 하이브리드 실행 계획을 생성한다. 구체적으로, LLM은 “SQL + 파이썬” 형태의 코드 스니펫을 자동 생성한다. SQL 부분은 후보 윈도우 ID를 반환하고, 파이썬 부분은 해당 원시 시계열 슬라이스를 불러와 정밀 연산(예: 피크 검증, 인과 관계 분석, 주기 탐지 등)을 수행한다. 이렇게 함으로써 원시 데이터에 대한 정확한 계산을 보장하면서도 전체 데이터셋을 전부 스캔하지 않아도 된다.
또한 SonarTS는 경험 기반 프롬프트 초기화와 지속적인 쿼리 로그 요약을 통해 플래너의 품질을 점진적으로 향상시킨다. 포스트프로세싱 단계에서는 결과를 스칼라, 타임스탬프, 구간, 혹은 구조화된 보고서 형태로 포맷하고, 시각화까지 제공한다.
평가를 위해 제안된 NLQTSBench는 4단계 계층적 과제(기본 연산, 패턴 인식, 의미 추론, 인사이트 합성)와 831개의 검증된 질의로 구성된다. 각 질의는 평균 11 000 포인트 규모의 윈도우를 포함하며, 정량적 지표(IoU, Set‑F1)와 실행 가능 프로그램을 함께 제공한다. 베이스라인으로 Text‑to‑SQL, TSQA, 그리고 최신 Time‑LLM·ChatTS 모델을 비교했을 때, SonarTS는 특히 형태·인과 관계를 요구하는 레벨 2·3 질의에서 30 % 이상 높은 정확도를 기록했다.
핵심 인사이트는 (1) 대규모 시계열 데이터베이스에서 형태 기반 질의를 효율적으로 처리하려면 심볼릭 인덱스와 신경망 기반 플래너의 결합이 필요하다는 점, (2) 완전한 원시 데이터 검증을 위한 파이썬 코드 자동 생성이 정확도와 확장성을 동시에 만족시킨다는 점, (3) NLQTSBench와 같은 대규모, 장기 히스토리를 포함한 벤치마크가 향후 연구의 표준이 될 가능성이 크다는 점이다.
댓글 및 학술 토론
Loading comments...
의견 남기기