머신러닝 기반 추천시스템 알고리즘 활용 현황과 연구 과제
초록
본 논문은 추천시스템에 적용된 머신러닝 알고리즘을 체계적으로 조사하고, 현재 가장 많이 사용되는 베이지안·의사결정트리 계열 알고리즘의 특성을 분석한다. 또한 요구사항 정의와 설계 단계에서의 연구 공백을 밝혀 소프트웨어 공학적 관점에서 향후 연구 방향을 제시한다.
상세 분석
본 체계적 문헌고찰은 2010년부터 2023년까지 주요 학술 데이터베이스(IEEE Xplore, ACM Digital Library, Scopus, Web of Science)를 대상으로 “recommender system”, “machine learning”, “algorithm” 등 키워드 조합을 사용해 1,842건의 논문을 검색한 뒤, 중복 제거와 품질 평가(Quality Assessment) 과정을 거쳐 124편의 실증 연구를 최종 선정하였다. 선정 논문은 알고리즘 유형, 적용 도메인(전자상거래, 미디어, 교육 등), 평가 지표(정확도, 다양성, 신뢰도) 및 구현 단계(요구사항, 설계, 구현, 테스트)별로 코딩되었다.
분류 결과, 베이지안 네트워크와 의사결정트리(랜덤 포레스트, Gradient Boosting 포함)가 전체 적용 사례의 38%를 차지했으며, 이는 알고리즘의 해석 가능성, 파라미터 튜닝 용이성, 소규모 데이터에서도 안정적인 성능을 제공한다는 점이 주요 요인으로 분석된다. 반면, 딥러닝 기반 협업 필터링(CNN, RNN, AutoEncoder)은 22%에 머물렀으며, 고성능 컴퓨팅 자원과 대규모 학습 데이터가 필요함에도 불구하고 특정 도메인(영상·음악 스트리밍)에서만 집중적으로 활용되는 경향을 보였다.
알고리즘 선택에 영향을 미치는 부수 요인으로는 데이터 스파스성, 사용자 행동의 시계열 특성, 도메인 특화 메타데이터 존재 여부가 제시되었다. 특히, 베이지안 모델은 사전 확률을 통해 신규 사용자 콜드 스타트 문제를 완화하는 데 효과적이며, 의사결정트리는 피처 중요도 분석을 통해 비즈니스 이해관계자와의 커뮤니케이션을 지원한다.
연구 단계별 분석에서는 요구사항 정의와 설계 단계에서 머신러닝 알고리즘의 선택·통합에 관한 체계적인 가이드라인이 거의 부재함을 확인했다. 대부분의 논문이 구현·평가 단계에 집중하고 있어, 알고리즘 선택 기준, 성능 예측 모델링, 설계 패턴(예: 플러그인 아키텍처) 등에 대한 소프트웨어 공학적 연구가 절실히 필요하다. 또한, 윤리·프라이버시 고려사항이 설계 단계에 반영되는 사례가 드물어, 책임감 있는 추천시스템 개발을 위한 규격화된 요구사항 모델링이 향후 과제로 제시된다.
결론적으로, 현재 추천시스템 연구는 알고리즘의 정확도 향상에 치중하는 반면, 시스템 전반의 품질 속성(확장성, 유지보수성, 투명성)과 개발 프로세스의 체계화는 미비한 상태이다. 이는 소프트웨어 엔지니어링과 인공지능 분야의 융합 연구가 필요함을 시사한다.
댓글 및 학술 토론
Loading comments...
의견 남기기