문화정렬 대형언어모델을 위한 온톨로지 기반 다중에이전트 추론
초록
OG‑MAR은 세계가치조사(WVS) 데이터를 활용해 가치‑관계 온톨로지를 구축하고, 인구통계적으로 유사한 응답자를 기반으로 가치‑페르소나 에이전트를 다중 생성한다. 온톨로지 일관성을 유지하면서 판단 에이전트가 최종 답변을 종합해 문화적으로 정렬된 출력과 투명한 추론 과정을 제공한다.
상세 분석
본 논문은 대형언어모델(LLM)이 사전학습 데이터의 지역 불균형과 구조화된 가치 표현 부재로 인해 문화적 오정렬을 일으키는 문제를 지적한다. 기존의 프롬프트 기반 스티어링, 값‑RAG, 다중에이전트 토론 등은 가치들을 독립적인 신호로 취급하거나 경험적 분포와의 연결이 약해 일관성·해석 가능성이 떨어진다. OG‑MAR은 이러한 한계를 극복하기 위해 네 가지 핵심 모듈을 설계한다.
-
값 요약 및 토픽화: WVS 원시 응답을 사전 정의된 12개 상위 도메인·다수의 하위 카테고리(총 76개 클래스)로 매핑하고, 각 클래스별로 요약 에이전트(G_sum)가 응답자를 위한 카테고리‑특화 요약(s_i,j)을 생성한다. 이를 통해 개인별 구조화된 가치 프로필 V_i를 구축한다.
-
온톨로지 구축: 도메인 전문가가 설계한 Competency Questions(CQ)을 이용해 LLM에게 두 상위 클래스 간의 관계를 서술하도록 유도한다. 각 CQ는 “c_a와 c_b 사이에 어떤 관계가 존재하는가?” 형태이며, LLM은 사전 정의된 클래스와 관계 텍스트만 사용해 자연어 삼중항(t_a,b = (c_a, p_a,b, c_b))을 만든다. 문화적 다양성을 반영하기 위해 6개 대륙·20명(지역당) 샘플을 조건으로 삼아 다문화 관점을 포함한다. 인간 전문가가 생성된 삼중항을 검증·편집해 최종 온톨로지(76 클래스, 150 관계)로 확정한다.
-
쿼리 분석·컨텍스트 검색: 입력 질의 q와 목표 인구통계 d_q에 대해 (i) 토픽‑카테고리 선택(G_topic)으로 관련 도메인·세부 카테고리를 추출하고, (ii) 해당 카테고리 내에서 임베딩 기반 유사도 점수를 활용해 온톨로지 삼중항을 상위 M개 선택한다. 동시에 d_q와 가장 유사한 K명의 응답자를 dense embedding 기반으로 검색해 V_q와 R_q를 얻는다.
-
다중 가치‑페르소나 에이전트 시뮬레이션: 각 검색된 개인 i에 대해 온톨로지(O_q)와 해당 개인의 가치 요약(V_i,q), 인구통계(d_i)를 결합한 컨텍스트 z_i를 구성한다. G_persona는 z_i와 질의 q를 입력받아 답변 ˆy_i와 자연어 추론 트레이스 ρ_i를 동시에 출력한다. 이렇게 얻은 A = { (ˆy_i, ρ_i) } 집합을 판단 에이전트(G_judge)에게 전달한다. 판단 에이전트는 (a) 온톨로지 일관성 검증, (b) 인구통계적 근접도 가중, (c) 다수 의견 합의를 메타‑어드저스팅 메커니즘으로 수행해 최종 문화정렬 답변을 산출한다.
실험에서는 GPT‑3.5‑Turbo, LLaMA‑2‑13B, Claude‑2, Gemini‑1.5 등 네 가지 백본 모델을 사용해 아시아·유럽·아프리카·북미·라틴아메리카·인도 등 6개 지역의 사회조사 벤치마크에 평가하였다. OG‑MAR은 기존 ValuesRAG, 문화‑프롬프트, 다중에이전트 토론 대비 평균 7.2%↑ 문화 정렬 점수, 5.4%↑ 견고성(노이즈·프롬프트 변형에 대한 안정성) 향상을 기록했다. 또한 온톨로지 기반 추론 트레이스는 인간 평가자에게 0.84의 높은 투명성 점수를 얻었다.
핵심 기여는 (1) 경험적 가치 분포와 온톨로지를 결합한 구조화된 문화 지식 베이스, (2) 인구통계 기반 유사도 검색을 통한 개인화된 가치‑페르소나 생성, (3) 온톨로지 일관성을 보장하는 메타‑판단 메커니즘, (4) 다양한 LLM 백본에 적용 가능한 모듈식 파이프라인이다. 한계로는 온톨로지 구축 시 전문가 의존도가 높고, CQ 설계가 도메인에 따라 달라질 수 있다는 점, 그리고 대규모 실시간 서비스에 적용하려면 검색·에이전트 비용 최적화가 필요하다는 점을 언급한다.
댓글 및 학술 토론
Loading comments...
의견 남기기