데이터 격리형 교차 도메인 시퀀스 추천을 위한 모델 병합 프레임워크 MergeRec
📝 원문 정보
- Title: MergeRec: Model Merging for Data-Isolated Cross-Domain Sequential Recommendation
- ArXiv ID: 2601.01753
- 발행일: 2026-01-05
- 저자: Hyunsoo Kim, Jaewan Moon, Seongmin Park, Jongwuk Lee
📝 초록 (Abstract)
현대의 추천 시스템은 도메인별 데이터에만 의존해 학습되기 때문에 여러 도메인에 걸친 일반화에 한계가 있다. 이러한 문제를 해결하고자 등장한 교차‑도메인 시퀀스 추천은 기존 방법이 사용자·아이템의 중복을 전제로 하거나 개인정보 보호를 무시하는 비현실적인 가정을 갖는다는 근본적인 한계가 있다. 본 연구는 원시 사용자 행동 데이터를 도메인 간에 공유할 수 없는 현실적인 상황을 “데이터‑격리형 교차‑도메인 시퀀스 추천”이라고 정의하고, 모델 병합 기반 새로운 프레임워크 MergeRec을 제안한다. MergeRec은 (1) 훈련‑프리 병합 기법을 이용한 병합 초기화, (2) 각 아이템을 가상 시퀀스로 취급해 실제 사용자 데이터를 사용하지 않고도 의미 있는 학습 샘플을 생성하는 가상‑사용자 데이터 구성, (3) 추천 손실과 증류 손실을 동시에 최적화하는 협업 병합 최적화의 세 가지 핵심 구성요소로 이루어진다. 첫 단계에서는 사전 학습된 도메인별 모델을 그대로 결합해 초기 병합 모델을 만든다. 두 번째 단계에서는 각 도메인에서 아이템 자체를 연속된 시퀀스로 변환해 가상 사용자 행동을 만들고, 이를 통해 병합 모델을 미세조정한다. 마지막 단계에서는 병합 가중치를 도메인별로 학습하면서, 병합 모델이 관련 아이템을 정확히 예측하도록 하는 추천 손실과, 기존 도메인 모델이 담고 있는 협업 필터링 신호를 전달하는 증류 손실을 공동으로 최소화한다. 광범위한 실험 결과, MergeRec은 원본 모델의 강점을 유지하면서도 미지의 도메인에 대한 일반화 성능을 크게 향상시켰으며, 기존 모델 병합 기법 대비 Recall@10에서 평균 17.21%의 개선을 기록하였다. 이는 모델 병합이 범용 추천 시스템을 구축하는 데 있어 확장 가능하고 효과적인 접근법이 될 수 있음을 입증한다. 소스 코드는 github.com/DIALLab-SKKU/MergeRec 에서 공개한다.💡 논문 핵심 해설 (Deep Analysis)

MergeRec은 이러한 제약을 “모델 병합”이라는 관점에서 접근한다. 모델 병합은 이미 학습된 도메인별 추천 모델을 직접 결합해 하나의 통합 모델을 만드는 방법으로, 데이터 자체를 이동시키지 않으면서도 각 도메인의 학습된 지식을 공유할 수 있다. 논문에서 제안한 세 단계는 각각 다음과 같은 역할을 수행한다.
-
병합 초기화: 훈련‑프리 병합 기법(예: 가중치 평균, 레이어‑와이즈 매핑)을 이용해 초기 통합 모델을 만든다. 이 단계는 별도의 추가 학습 없이도 각 도메인 모델의 파라미터를 조화롭게 결합해, 이후 최적화가 안정적으로 진행될 수 있는 베이스라인을 제공한다.
-
가상‑사용자 데이터 구성: 각 아이템을 “가상 시퀀스”로 변환한다는 아이디어는 매우 창의적이다. 구체적으로, 아이템 i를 (i₁, i₂, …, iₖ) 형태의 순서열로 간주하고, 이를 가상의 사용자 행동으로 활용한다. 이렇게 하면 실제 사용자 로그가 없어도 시퀀스‑기반 모델(예: Transformer‑SASRec, GRU4Rec)을 학습시킬 수 있는 충분한 입력을 생성한다. 이 과정은 도메인 간 아이템 중복이 없어도 적용 가능하며, 아이템 자체의 메타데이터(카테고리, 속성)와 결합하면 더욱 풍부한 시퀀스를 만들 수 있다.
-
협업 병합 최적화: 최종 목표는 두 가지 손실을 동시에 최소화하는 것이다. (a) 추천 손실(예: BPR, CE)은 병합 모델이 실제 추천 과업에서 높은 정확도를 달성하도록 유도한다. (b) 증류 손실은 각 도메인별 파인‑튜닝된 모델이 가진 협업 필터링 신호(예: 사용자‑아이템 관계, 아이템 간 유사도)를 병합 모델에 전달한다. 여기서 사용된 지식 증류는 온‑디멘션(soft target) 방식으로, 온도 파라미터와 가중치 스케일링을 통해 원본 모델의 확률 분포를 부드럽게 전이한다.
실험 설계는 5개의 공개 시퀀스 데이터셋(예: MovieLens‑1M, Amazon‑Books, Yelp)에 대해 교차‑도메인 설정을 구성하고, 기존 모델 병합 기법(단순 평균, FedAvg) 및 교차‑도메인 시퀀스 추천 모델(예: CoNet, DDTCDR)과 비교하였다. 결과는 Recall@10, NDCG@10 등 주요 지표에서 평균 17.21%의 향상을 보였으며, 특히 데이터 격리 상황에서 성능 저하가 거의 없었다는 점이 주목할 만하다.
하지만 몇 가지 한계도 존재한다. 첫째, 가상‑사용자 데이터는 아이템 자체의 순서 정보를 인위적으로 부여하기 때문에, 실제 사용자 행동의 복잡한 의도(시간 간격, 컨텍스트)를 완전히 재현하지 못한다. 둘째, 병합 가중치를 도메인별로 학습하는 과정에서 최적화 비용이 증가할 수 있다(특히 대규모 모델일 경우). 셋째, 현재 실험은 도메인 수가 제한적이며, 매우 이질적인 도메인(예: 음악 vs. 뉴스) 간 확장성 검증이 필요하다.
향후 연구 방향으로는 (1) 가상 시퀀스 생성에 시간적·콘텍스트 정보를 포함하는 고도화된 프리프로세싱, (2) 메타‑학습 기반의 병합 가중치 자동 조정, (3) 프라이버시‑보호를 강화한 안전한 모델 병합 프로토콜(예: Secure Multi‑Party Computation, Homomorphic Encryption) 등을 고려할 수 있다. 전반적으로 MergeRec은 데이터 격리 환경에서도 효과적인 교차‑도메인 시퀀스 추천을 가능하게 하는 실용적인 프레임워크이며, 모델 병합이라는 새로운 패러다임을 제시함으로써 향후 범용 추천 시스템 연구에 중요한 이정표가 될 것으로 기대된다.
📄 논문 본문 발췌 (Translation)
📸 추가 이미지 갤러리