다양성을 위한 레시피 적응 RAG 프레임워크
초록
본 논문은 문화 간 레시피 변환 작업에서 기존 RAG 모델이 컨텍스트 다양성을 충분히 활용하지 못해 출력이 단조롭다는 문제를 지적하고, 검색·재배열·동적 컨텍스트 조직·대조적 컨텍스트 삽입이라는 네 단계의 다양성 강화 모듈을 결합한 CARRIAGE 프레임워크를 제안한다. 실험 결과 CARRIAGE가 품질과 다양성 모두에서 폐쇄형 LLM을 능가하며 파레토 효율을 달성함을 보인다.
상세 분석
본 연구는 문화 간 레시피 적응이라는 창의적 텍스트 생성 과제에서 Retrieval‑Augmented Generation(RAG)의 한계를 심도 있게 탐구한다. 먼저, 표준 RAG 파이프라인이 소스 레시피를 질의로 사용해 목표 문화의 레시피를 검색하고, 상위 k개의 결과를 LLM에 전달해 하나의 적응 레시피를 생성한다는 전형적인 흐름을 재현한다. 실험을 통해 동일한 질의에 대해 다양한 검색 결과를 제공하더라도 LLM이 동일한 컨텍스트 조각에 과도하게 의존해 출력 다양성이 현저히 낮아짐을 확인한다. 이는 네 가지 주요 결함(C1‑C4)으로 구분된다.
C1은 문화적 차이로 인해 원본 레시피와 표면적으로 일치하지 않는 적절한 후보가 검색되지 않는 문제이며, C2는 재랭킹 단계에서 순수 관련도만을 기준으로 하여 유사한 레시피가 반복 선택되는 현상이다. C3은 사용자가 동일 질의를 반복해도 IR 시스템이 동일한 결과를 반환하고, LLM이 반환된 컨텍스트 전체를 고르게 활용하지 못해 실제 정보 다양성이 손실되는 점을 지적한다. 마지막으로 C4는 생성 단계에서 이전 출력과의 차별성을 명시적으로 유도하지 않아 모델이 이미 생성한 레시피와 유사한 결과를 반복 생산한다는 것이다.
이러한 문제를 해결하기 위해 제안된 CARRIAGE는 네 가지 모듈을 순차적으로 적용한다. 첫 번째 단계인 쿼리 리라이팅은 원본 레시피의 제목과 핵심 어휘를 문화에 맞게 변형함으로써 검색 엔진이 문화적 변형을 반영한 후보를 더 많이 회수하도록 만든다. 두 번째 단계인 다양성‑인식 재랭킹은 전통적인 MMR(Maximal Marginal Relevance) 공식을 확장해, 현재 선택된 후보와 과거에 생성된 레시피 모두와의 유사도를 최소화하도록 λ 파라미터를 조정한다. 이는 검색 결과 자체의 다양성을 확보하면서도 목표 문화와의 관련성을 유지한다.
세 번째 단계인 동적 컨텍스트 조직은 k개의 검색 결과를 슬라이딩 윈도우 방식으로 분할해 각 생성 라운드마다 서로 다른 서브셋을 LLM에 입력한다. 이렇게 하면 LLM이 매 라운드마다 다른 레시피 조각을 참고하게 되어, 동일 질의라도 출력이 서로 다른 방향으로 전개될 가능성이 높아진다. 마지막 단계인 대조적 컨텍스트 삽입은 이전에 생성된 레시피를 “피해야 할” 컨텍스트로 명시적으로 제공함으로써, LLM이 이미 만든 레시피와 중복되지 않는 새로운 변형을 만들도록 유도한다.
평가에서는 **레시피 문화 적합성 점수(Recipe Cultural Appropriateness Score)**를 포함한 다중 자동 메트릭을 설계했으며, 어휘 다양성(Unique‑n), 의미 다양성(문장‑BERT 기반 코사인 거리) 등을 정량화했다. 실험 결과 CARRIAGE는 기존 RAG와 폐쇄형 LLM 대비 어휘·의미·재료 다양성에서 평균 15‑20% 향상을 보였으며, 문화 적합성 점수와 원본 보존도에서도 손실 없이 유지되었다. 특히 Pareto 차트 상에서 품질과 다양성 모두를 동시에 최적화하는 지점을 차지함으로써, “다양성 vs 품질” 트레이드오프를 효과적으로 완화했다는 점이 강조된다.
이 논문은 RAG 기반 생성 모델이 단일 정답이 아닌 다중 정답을 요구하는 창의적 작업에 적용될 때, 검색 단계와 생성 단계 모두에서 다양성 의식을 설계에 통합해야 함을 실증적으로 보여준다. 또한, 플러그‑인 형태의 모듈식 접근법을 채택함으로써 기존 LLM이나 검색 엔진을 교체하지 않고도 손쉽게 적용 가능하다는 실용적 장점도 제공한다. 향후 연구에서는 사용자 선호도 기반의 적응형 λ 튜닝, 멀티모달 레시피 이미지와의 연계, 그리고 인간 평가를 통한 문화적 미묘함 검증 등이 제안된다.
댓글 및 학술 토론
Loading comments...
의견 남기기