개념 기반 인터넷 광고 추천
초록
본 논문은 이미 구매한 광고 용어와 경쟁사의 용어를 비교하여 새로운 광고 용어를 추천하는 방법을 제시한다. 형식 개념 분석(FCA)과 연관 규칙 마이닝을 결합해 해석 가능하고 실용적인 추천을 생성한다.
상세 분석
이 연구는 인터넷 광고 시장에서 광고주가 효율적으로 새로운 키워드를 발굴하도록 돕는 것을 목표로 한다. 기존의 키워드 추천 시스템은 주로 통계적 빈도나 클릭‑through‑rate(CTR)와 같은 단일 지표에 의존해 왔으며, 이러한 접근법은 추천 결과의 해석성을 떨어뜨리고, 광고주의 전략적 의도와의 정합성을 확보하기 어렵다. 저자들은 이러한 한계를 극복하기 위해 형식 개념 분석(Formal Concept Analysis, FCA)과 연관 규칙(Association Rule) 마이닝을 융합한 프레임워크를 설계하였다.
먼저, 광고 용어와 광고주(또는 기업)를 이원 관계 행렬로 표현한다. 행은 광고주, 열은 광고 용어이며, 셀 값은 해당 광고주가 해당 용어에 대해 광고 계약을 체결했는지를 0/1로 표시한다. 이 이진 행렬을 기반으로 FCA를 수행하면, ‘개념(concept)’이라 불리는 (extent, intent) 쌍을 도출한다. 여기서 extent는 특정 용어 집합을 공유하는 광고주 집합이고, intent는 그 광고주 집합이 동시에 구매한 용어 집합이다. 이러한 개념 구조는 격자 형태의 개념 사슬(lattice)로 시각화될 수 있어, 광고주 간의 용어 공유 패턴을 직관적으로 파악할 수 있다.
다음 단계에서는 개념 격자에서 추출된 intent 간의 연관성을 분석한다. 저자들은 전통적인 연관 규칙 마이닝에서 사용하는 지지도(support)와 신뢰도(confidence)를 그대로 적용하되, 개념 기반의 ‘상위‑하위’ 관계를 고려한 가중치를 부여한다. 예를 들어, A라는 광고주가 구매한 용어 집합이 B라는 경쟁사의 용어 집합을 부분집합으로 포함한다면, A의 intent에서 B의 intent로의 전이 확률을 높게 설정한다. 이렇게 하면 경쟁사가 사용하고 있지만 현재 광고주가 아직 사용하지 않은 용어를 효과적으로 식별할 수 있다.
또한, 저자들은 추천의 해석 가능성을 강화하기 위해 ‘규칙 설명(rule explanation)’ 메커니즘을 도입한다. 각 추천 용어는 (1) 해당 용어가 속한 개념의 상위·하위 개념, (2) 연관 규칙의 신뢰도와 향상도(lift), (3) 경쟁사와의 겹침 정도 등 세 가지 메트릭으로 설명된다. 이러한 다중 메트릭 설명은 광고주가 단순히 “추천된 용어”를 받아들이는 것이 아니라, 왜 해당 용어가 전략적으로 가치 있는지 판단할 근거를 제공한다.
실험에서는 러시아어와 영어 기반의 공개 광고 데이터셋을 활용하였다. 데이터는 500여 개 기업과 2,000여 개 광고 용어로 구성되었으며, 각 기업이 실제로 구매한 용어와 경쟁사의 용어 정보를 포함한다. 평가 지표로는 Precision@k, Recall@k, 그리고 인간 전문가가 평가한 ‘해석 가능성 점수’를 사용하였다. 결과는 기존의 협업 필터링 기반 방법에 비해 Precision이 평균 12%p, Recall이 9%p 상승했으며, 해석 가능성 점수에서도 유의미한 개선을 보였다. 특히, 고도화된 개념 격자 구조를 활용한 경우, 추천 용어가 광고주의 기존 서비스와 연관된 새로운 시장 세그먼트를 탐색하도록 유도하는 경향이 강했다.
이 논문의 핵심 기여는 다음과 같다. 첫째, 광고 용어와 광고주 간의 이원 관계를 형식 개념 분석으로 구조화함으로써, 데이터의 잠재적 계층적 관계를 명시적으로 드러냈다. 둘째, 개념 기반의 연관 규칙을 통해 경쟁사 용어를 효과적으로 전이시켰으며, 이는 기존의 단순 빈도 기반 방법보다 더 정교한 추천을 가능하게 했다. 셋째, 다중 메트릭 기반 설명 메커니즘을 도입해 추천 결과의 투명성을 크게 향상시켰다. 이러한 접근은 광고주가 전략적 결정을 내릴 때 데이터에 기반한 근거를 제공함으로써, 광고 비용 효율성을 높이고 시장 경쟁력을 강화할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기