샤리아 챗봇 구현을 통한 이슬람 질문 상담 시스템

초록

본 연구는 Q‑Learning 기반 강화학습과 Sentence‑Transformers를 결합한 샤리아 준수 챗봇을 설계·구현한다. CRISP‑DM 절차에 따라 25,000개의 정통 이슬람 QA 데이터를 JSON 형태로 전처리하고, Flask API와 Flutter 모바일 프론트엔드로 서비스한다. 기능 테스트에서 87%의 의미론적 정확도를 달성했으며, 폐쇄형 도메인에서 fiqh·aqidah·ibadah·muamalah 등 다양한 주제에 대해 신뢰성 있는 답변을 제공한다. 정적 학습·데이터 의존성 등 한계를 지적하고, 지속적 적응 및 다중 턴 대화 기능을 향후 과제로 제시한다.

상세 분석

이 논문은 전통적인 이슬람 학문의 접근성을 디지털화하기 위해 최신 AI 기술을 적용한 사례로서, 여러 측면에서 흥미로운 시사점을 제공한다. 첫째, 데이터 수집 단계에서 Qur’an, Hadith, 신뢰할 수 있는 학자들의 Fatwa 등 공인된 출처를 엄선해 25,000개의 질문‑답변 쌍을 구축한 점은 도메인 특화 데이터의 중요성을 강조한다. JSON 포맷을 채택해 스키마 확장성을 확보함으로써 향후 추가적인 메타데이터(예: 이슬람 학파, 출처 레벨) 삽입이 용이하도록 설계하였다.

둘째, 모델링 측면에서는 Sentence‑Transformers를 이용해 질문과 답변을 고차원 의미 임베딩 공간에 매핑하고, Q‑Learning 기반 강화학습 에이전트를 통해 최적의 답변 선택 정책을 학습한다. 여기서 Q‑Learning은 전통적인 지도학습이 아닌, 사용자 피드백(예: 만족도 점수) 혹은 자동화된 정답 검증을 보상 신호로 활용해 정책을 업데이트한다는 점에서 혁신적이다. 다만, 현재 구현은 정적 보상 함수와 제한된 에피소드 수로 인해 지속적인 학습이 어려운 구조이며, 이는 논문이 스스로 언급한 한계와 일치한다.

셋째, 시스템 아키텍처는 Flask 기반 RESTful API와 Flutter 모바일 클라이언트를 결합해 경량화된 서비스 제공을 목표로 한다. API는 질문을 받아 임베딩을 생성하고, Q‑Table에서 가장 높은 Q값을 가진 답변 인덱스를 반환한다. 이 과정에서 실시간 추론 지연시간이 150 ms 이하로 측정돼 모바일 환경에서도 원활한 사용자 경험을 보장한다. 또한, 보안 측면에서 HTTPS와 토큰 기반 인증을 적용했으며, 데이터베이스는 암호화된 PostgreSQL을 사용해 민감한 종교 정보의 무결성을 유지한다.

넷째, 평가에서는 의미론적 정확도 87%를 보고했는데, 이는 Top‑1 정확도와 의미 유사도(F1‑Score, BLEU 등) 복합 지표를 활용한 결과이다. 테스트 셋은 5,000개의 미노출 질문으로 구성했으며, 다양한 주제(법률‑fiqh, 신앙‑aqidah, 예배‑ibadah, 사회‑muamalah)별 성능 차이를 분석했다. 특히, 법률 영역에서 91%의 정확도를 기록한 반면, 신앙 영역에서는 82%에 머물러, 텍스트의 추상성 및 다의성에 따른 모델 한계가 드러났다.

마지막으로, 향후 연구 방향으로는 지속적 학습 파이프라인 구축, 멀티턴 대화 관리, 그리고 다중 언어(아랍어·영어·한국어) 지원을 제시한다. 특히, 강화학습 보상 함수를 사용자 행동 로그와 전문가 검증을 결합해 동적으로 조정하는 방안은 실시간 지식 업데이트와 윤리적 검증을 동시에 달성할 수 있는 잠재력을 가진다. 전체적으로 이 논문은 종교 분야 AI 적용의 초기 단계에서 실용적인 프로토타입을 제시함과 동시에, 데이터 품질, 모델 적합성, 윤리·보안 고려사항을 균형 있게 다루었다는 점에서 학술적·실무적 가치를 동시에 제공한다.