텍스트 마이닝과 사회망 분석을 결합한 안드로이드 사용자 리뷰 인사이트 탐색
초록
본 연구는 구글 플레이에 게시된 안드로이드 운영체제 사용자 리뷰를 대상으로 텍스트 마이닝과 사회망 분석(SNA)을 결합하여 기능 결함·요구 사항을 파악한다. 텍스트 마이닝으로 주요 결함 키워드와 연관 토픽을 추출하고, SNA로 키워드 간 연결 구조와 커뮤니티를 시각화·분석한다. 결과는 단순 빈도 기반 분석을 넘어 사용자 요구의 복합적 관계를 드러내며, 제품 개선 및 커뮤니티 관리에 실용적 인사이트를 제공한다.
상세 분석
이 논문은 모바일 앱 스토어에서 생성되는 방대한 사용자 리뷰를 효율적으로 분석하기 위해 두 가지 데이터 과학 기법을 통합한다. 첫 단계에서는 크롤링을 통해 안드로이드 OS 관련 리뷰 10만 건을 수집하고, 형태소 분석·불용어 제거·어간 추출을 수행해 정제된 텍스트 코퍼스를 만든다. 이후 TF‑IDF 가중치를 기반으로 주요 키워드를 선정하고, LDA(Latent Dirichlet Allocation) 토픽 모델링을 적용해 ‘GPS 오류’, ‘배터리 소모’, ‘앱 호환성’ 등 12개의 의미 있는 토픽을 도출한다. 텍스트 마이닝만으로는 각 키워드가 어느 토픽에 속하는지 알 수 있지만, 키워드 간의 상호작용은 파악하기 어렵다. 이를 보완하기 위해 키워드 공동 등장 행렬을 구축하고, 이를 무방향 가중치 그래프로 변환해 사회망 분석을 수행한다. 네트워크 중심성(연결 중심성, 매개 중심성) 측정을 통해 ‘GPS’, ‘배터리’, ‘업데이트’가 네트워크의 핵심 허브임을 확인했으며, 모듈러리티 기반 커뮤니티 탐지를 통해 ‘위치 서비스 문제’와 ‘전원 관리 문제’가 별개의 서브네트워크로 형성되는 것을 밝혀냈다. 특히, 동일 토픽 내에서도 서로 다른 커뮤니티에 속한 키워드가 존재함을 보여, 사용자가 동일 기능에 대해 서로 다른 불만·요구를 제기한다는 복합성을 드러낸다. 이러한 결과는 제품 로드맵 수립 시 단순 빈도 순위가 아닌, 키워드 간 구조적 관계와 커뮤니티 특성을 고려해야 함을 시사한다. 또한, 리뷰 작성자 간의 상호작용(예: 댓글, 추천) 메타데이터를 추가로 활용하면, 영향력 있는 사용자 그룹을 식별해 우선 대응 전략을 설계할 수 있다. 논문은 방법론적 한계로 리뷰의 언어적 다양성(다국어, 방언)과 감성 분석의 정확도 문제를 언급하고, 향후 딥러닝 기반 문맥 모델과 동적 네트워크 분석을 결합해 실시간 인사이트 제공 방안을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기