부동산 그래프 상에서의 반사실 추천 시스템
초록
CFRecs는 사용자‑리스트링 상호작용 그래프를 이용해 GNN과 Graph‑VAE를 결합한 두 단계 구조를 제안한다. 기존 GNN 기반 추천의 해석성을 높이고, 최소한의 구조·속성 변화를 통해 거래 가능성을 높이는 반사실 그래프를 생성한다. Zillow 데이터 실험을 통해 구매자·판매자에게 실질적인 행동 권고를 제공함을 입증한다.
상세 분석
본 논문은 그래프 신경망(GNN)의 블랙박스 특성을 보완하기 위해 반사실 그래프 학습(counterfactual graph learning)을 추천 시스템에 적용한 최초 사례 중 하나이다. 핵심 아이디어는 “사실 그래프”와 “반사실 그래프” 사이의 차이를 최소화(sparsity)하면서, 반사실 그래프가 목표 라벨(거래 발생) > 사실 그래프의 라벨을 갖도록 하는 두 가지 목적을 동시에 최적화하는 것이다. 이를 위해 저자들은 두 단계 파이프라인을 설계하였다. 첫 번째 단계에서는 다중 유형(조회, 저장, 문의) 에지와 사용자·리스트링 속성을 입력으로 하는 GNN을 학습시켜, 각 서브그래프가 거래 가능성 ≈ 𝑝(y=1|G) 를 출력하도록 한다. 두 번째 단계에서는 학습된 GNN을 고정하고, Graph‑VAE를 이용해 잠재 공간에서 작은 변형을 가한다. VAE의 디코더는 변형된 잠재 벡터를 다시 그래프(에지 마스크와 속성 마스크)로 복원하는데, 여기서 에지 마스크는 새로운 상호작용(예: 사용자가 아직 보지 않은 매물에 대한 조회) 혹은 기존 에지의 삭제를 의미하고, 속성 마스크는 사용자의 선호도 조정(예: 예산 상향) 혹은 매물 가격 변동을 의미한다.
목표 함수는 (1) ℓ₁‑정규화 기반의 sparsity 손실, (2) GNN 예측값을 목표 라벨(거래 가능) 쪽으로 이동시키는 validity 손실, (3) VAE의 KL‑divergence와 재구성 손실을 결합한다. 특히 부동산 도메인에서는 일부 속성(침실 수, 면적 등)은 변형이 불가능하므로, 마스크 설계 시 변형 가능한 속성(가격, 사용자 예산, 선호도 히스토그램)만을 허용하도록 제약을 추가한다.
데이터 전처리 단계에서는 거대한 사용자‑리스트링 이중이분 그래프를 무작위 워크(Random Walk) 기반 서브그래프 추출 알고리즘으로 분할한다. 이때 거래가 실제 발생한(positive) 서브그래프와 발생하지 않은(negative) 서브그래프를 균형 있게 샘플링해 학습 안정성을 확보한다. 실험에서는 Zillow의 6개월간 인터랙션 로그(수백만 에지, 수십만 사용자·리스트링)를 사용했으며, 주요 평가지표는 (i) 거래 예측 정확도, (ii) 반사실 그래프 생성 시 평균 변형 수, (iii) 실제 비즈니스 KPI(예: 평균 거래 소요 시간 감소)이다. 결과는 CFRecs가 기존 GNN 기반 추천보다 거래 예측 AUC를 3.2%p 상승시켰으며, 평균 변형 수는 전체 에지의 1.8% 수준으로 매우 희소함을 보였다. 또한, 시뮬레이션된 “구매자 행동 권고”(예: 특정 매물 조회 권유)와 “판매자 리스팅 조정”(가격 인하) 시나리오에서 실제 Zillow 내부 A/B 테스트와 유사한 거래 증가 효과를 재현했다.
이러한 설계는 반사실 그래프가 단순히 설명용이 아니라, 실제 운영 정책에 바로 적용 가능한 “추천”으로 전환될 수 있음을 증명한다. 특히, 도메인 제약을 마스크 설계에 반영하고, 전체 그래프 수준에서 전역 최적화를 수행한다는 점이 기존 노드‑레벨 혹은 서브그래프‑레벨 반사실 방법과 차별화된다.
댓글 및 학술 토론
Loading comments...
의견 남기기