LLM 기반 다중 프로필 추출로 추천 성능을 혁신하다

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

이 논문은 대규모 언어 모델(LLM)의 생성 능력을 활용해 사용자와 아이템에 대한 단일 프로필의 한계를 극복하는 통합 추천 프레임워크 ‘ProEx’를 제안합니다. 체인-오브-생각 추론을 통해 다각도의 프로필을 생성하고, 이를 ‘환경’ 개념으로 통합해 사용자 선호도의 본질적 불변성을 추출함으로써 기존 추천 모델의 성능을 크게 향상시킵니다.

상세 분석

ProEx 프레임워크의 기술적 핵심은 크게 두 가지로 나뉩니다. 첫째는 ‘다면적 프로필 구성(Multi-faceted Profile Construction)‘입니다. 기존 LLM 기반 프로파일링이 단일 텍스트 설명에 의존해 사용자 의도의 복잡성을 놓치거나 LLM의 불안정성(할루시네이션, 편향 등)에 취약한 점을 지적하며, 이를 해결하기 위해 4단계의 체인-오브-생각(CoT) 추론 과정을 설계했습니다. 사용자의 상호작용 기록과 부가 정보를 입력으로, 원본 프로필 생성 → 긍정/부정 측면 추출 → 잠재적 선호도 분석 → 다중 신규 프로필 생성의 단계를 거쳐 의미적으로 다양하면서도 근거 있는 프로필 세트를 생성합니다. 특히 마지막 단계에서는 원본 프로필과 어휘 및 표현이 완전히 다른 신규 프로필 생성을 요구하여 표현적 붕괴와 인기 편향을 완화합니다.

둘째는 생성된 다중 프로필을 효과적으로 활용하는 ‘프로필 외삽(Profile Extrapolation)’ 및 ‘환경 기반 정규화’ 메커니즘입니다. 텍스트 임베딩 모델을 통해 프로필을 고차원 언어 공간의 의미 벡터로 변환한 후, 협업 필터링 공간과의 차원 정렬을 위한 매핑 함수를 적용합니다. 여기서 핵심 혁신은 ‘환경(Environment)’ 개념의 도입입니다. 각 환경은 모든 프로필 벡터의 서로 다른 선형 조합으로 정의되며, 다양한 환경 하에서의 예측 차이를 최소화하는 정규화(Invariance Regularization)를 수행합니다. 이는 노이즈가 섞인 개별 프로필에 과적합되는 것을 방지하고, 다양한 프로필 조합 속에서도 변하지 않는 사용자 선호도의 핵심 불변 특성(invariant features)을 추출하는 데 목적이 있습니다. 추가적으로 대조 학습 정규화를 통해 프로필 표현이 언어 공간 내에서 더 균일하고 광범위한 영역을 커버하도록 유도합니다. 이 프레임워크는 판별적(예: MF, LightGCN)과 생성적(예: VAE, CVAE) 추천 모델 아키텍처 모두에 적용 가능한 모델 불가지론적 설계를 지향합니다.

LLM 기반 다중 프로필 추출로 추천 성능을 혁신하다

초록

상세 분석

댓글 및 학술 토론

의견 남기기