지능형 레이어를 통한 자연어 기반 유연 쿼리 변환 시스템
본 논문은 사용자가 자연어 형태로 제시하는 유연한 질의를 지능형 레이어가 자동으로 구조화된 SQL 문으로 변환하고, 실행 결과에 대한 피드백을 학습해 향후 동일 질의에 대한 정확도를 높이는 시스템을 제안한다.
저자: Mrs. Neelu Nihalani, Dr. Sanjay Silakari, Dr. Mahesh Motwani
본 논문은 데이터베이스 사용의 진입 장벽을 낮추고, 비전문가가 자연어 형태로 질의를 제시할 수 있도록 지원하는 ‘지능형 레이어(Intelligent Layer)’를 설계·구현하였다. 서론에서는 현대 기업·학계·정부기관이 다루는 방대한 데이터와 기존 DBMS가 제공하는 Boolean 기반 선택 쿼리의 한계를 지적하고, 자연어 질의와 언어 변수 사용에 대한 필요성을 강조한다. 이어지는 문헌 검토에서는 지능형 데이터베이스(IDB)와 인공지능(AI) 통합 연구, 퍼지 집합 기반 모델, 온톨로지 활용, 데이터 마이닝 및 무결성 검사 등 관련 분야의 주요 연구들을 정리한다. 특히, 기존 연구가 주로 지식 표현·추론·자동 데이터 정제에 초점을 맞춘 반면, 본 연구는 질의 변환 파이프라인에 집중한다는 점을 차별점으로 제시한다.
제안된 시스템 구조는 크게 네 단계로 구성된다. 첫 번째 단계는 사용자로부터 자연어 질의를 입력받아 ‘접속사 훈련 집합(Conjunction Training Set)’을 이용해 논리적 접속사를 식별하고, 이를 기준으로 질의를 ‘표시 부분(Subjective/Display)’과 ‘조건 부분(Criteria)’으로 분리한다. 두 번째 단계에서는 ‘표현 매핑 집합(Expression Mapping)’을 활용해 조건 부분에 포함된 자연어 연산자를 SQL 연산자(>, <, = 등)로 변환하고, 불용어(stop‑words)를 제거한다. 세 번째 단계는 메타데이터(M)와 온톨로지(S) 기반 의미 매칭을 수행한다. 여기서 테이블·필드명을 찾지 못할 경우 레벤슈타인 거리 알고리즘을 적용해 철자 오류나 동의어를 보정한다. 이렇게 추출된 테이블명과 필드명, 변환된 조건식을 조합해 최종 SQL 문을 생성한다. 네 번째 단계는 생성된 SQL을 기존 DBMS에 전달해 실행하고, 결과를 사용자에게 제시한다. 결과에 대해 사용자는 수용 여부를 피드백으로 제공하며, 이 피드백은 ‘지식 기반 자기 학습 시스템’에 저장된다. 저장된 피드백은 향후 동일하거나 유사한 질의가 들어올 때 자동으로 매핑 규칙을 선택·조정하는 데 활용된다.
실험에서는 제안 시스템을 기존의 키워드 기반 자연어 질의 변환 도구와 비교하여, 질의 정확도와 사용자 만족도 측면에서 우수함을 보였다. 특히, 접속사 기반 구조 분석과 온톨로지·레벤슈타인 거리 결합이 오타와 동의어 처리에 효과적임을 확인하였다. 그러나 실험 환경이 제한적이며, 대규모 데이터베이스에 대한 성능 평가가 부족한 점이 논문의 한계로 지적된다.
결론에서는 제안된 지능형 레이어가 자연어 질의를 구조화된 SQL로 변환하고, 사용자 피드백을 통해 지속적으로 학습함으로써 데이터베이스 접근성을 크게 향상시킬 수 있음을 강조한다. 향후 연구 과제로는 온톨로지 자동 구축, 대규모 실시간 처리 성능 최적화, 그리고 다양한 도메인에 대한 적용 가능성 검증이 제시된다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기