브랜드 인텔리전스 분석
초록
본 논문은 빅데이터 기반 텍스트를 활용해 브랜드 인지도와 연관성을 정량적으로 파악하는 SBS Brand Intelligence App(SBS BI)의 기능을 소개한다. 2020년 미국 민주당 프라이머리를 사례로 5만 건의 온라인 기사(주류·블로그)를 수집·전처리하고, 단어 동시출현 네트워크를 구축해 사회망분석(SNA)과 텍스트 마이닝을 결합해 브랜드와 이슈 간 긍정·부정 연관성을 시각화·정량화한다.
상세 분석
본 연구는 크게 네 단계로 구성된다. 첫째, 데이터 수집 단계에서는 Event Registry API를 이용해 2020년 미국 민주당 프라이머리와 관련된 키워드(예: “Biden”, “Sanders”, “Democratic primary”)를 설정하고, 전 세계 언론·블로그에서 50,000개의 기사 본문을 크롤링하였다. 수집된 텍스트는 HTML 태그 제거, 토큰화, 불용어(stop‑word) 및 형태소 정규화 과정을 거쳐 정제되었다. 둘째, 정제된 텍스트를 기반으로 단어‑단어 동시출현 행렬을 구축하고, 일정 빈도 이상(예: 5회 이상) 등장하는 단어쌍을 엣지로, 단어 자체를 노드로 하는 무방향 가중 네트워크를 생성하였다. 셋째, 이 네트워크에 사회망분석 기법을 적용하였다. 중심성 지표(디그리, 베트위니, 클로즈니스)를 통해 브랜드(후보자)와 핵심 이슈(정책·스캔들)의 상대적 중요도를 평가하고, 커뮤니티 탐지(Louvain 알고리즘)를 통해 연관된 토픽 군집을 식별하였다. 넷째, 텍스트 마이닝 기법—특히 감성 사전 기반 감성 분석과 토픽 모델링(LDA)—을 네트워크 노드에 부착해 각 브랜드‑이슈 연결의 긍정·부정 정서를 정량화하였다. 이러한 다중 레이어 접근은 전통적인 설문 기반 브랜드 인지도 조사와 달리 실시간·대규모 여론 흐름을 포착한다는 장점이 있다.
핵심 인사이트는 다음과 같다. (1) “Biden” 노드는 높은 디그리 중심성을 보이며, “COVID‑19”, “economy” 등 정책 이슈와 강하게 연결돼 있다. 반면 “Sanders”는 “climate change”, “healthcare”와 같은 진보적 토픽에 집중된 서브커뮤니티를 형성한다. (2) 감성 분석 결과, “Biden”과 “economy” 간 연결은 전반적으로 긍정적(평균 감성 점수 +0.23)인 반면, “Biden”‑“scandal” 연결은 부정적(−0.41)으로 나타나 여론의 양면성을 드러낸다. (3) 시간 흐름을 고려한 동적 네트워크 분석을 통해 주요 토론 주제가 선거 일정에 따라 급격히 전환되는 패턴을 확인하였다.
제한점으로는 (i) 기사 출처의 편향성(특정 국가·언론에 과다 의존)과 (ii) 감성 사전의 문화·정치적 차이에 따른 오분류 가능성을 들 수 있다. 향후 연구에서는 다국어 감성 사전 구축과, 사용자 행동 데이터(소셜 미디어, 검색 로그)와의 융합을 통해 브랜드 인텔리전스의 정확도와 적용 범위를 확대할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기