클릭이 운명을 결정한다 MOOC 비디오 클릭스트림으로 학습 정보 처리와 이탈 행동 추론
초록
본 논문은 MOOC 동영상 강의에서 수집된 클릭스트림 데이터를 행동 단위로 전환하고, 인지심리학 기반의 정보처리 지수(IPI)를 구축한다. IPI와 기타 클릭 행동 특성을 활용해 학습자의 몰입도, 향후 클릭 예측, 영상 내 이탈 패턴을 분석하고, 최종적으로 코스 전체 탈락을 예측한다. 다양한 통계·머신러닝 모델을 적용해 행동 프로파일을 군집화하고, 강의 설계 개선 및 학습자 지원에 활용할 수 있는 인사이트를 제공한다.
상세 분석
이 연구는 MOOC 환경에서 가장 핵심적인 학습 매체인 동영상 강의의 클릭스트림을 정량화하는 방법론을 제시한다. 먼저 원시 로그 데이터를 ‘play’, ‘pause’, ‘seek‑forward’, ‘seek‑backward’, ‘rate‑change’ 등 5가지 기본 행동으로 매핑하고, 각 행동에 시간적 지속성과 빈도를 부여한다. 이러한 행동 시퀀스를 기반으로 인지심리학의 ‘작업 기억 부하’와 ‘심층 처리’ 개념을 차용해 정보처리 지수(IPI)를 설계한다. IPI는 긍정적 행동(예: pause 후 메모, rewind)에는 가중치를 높게, 피상적 행동(예: fast‑forward, 속도 증가)에는 가중치를 낮게 부여하는 선형 합산 방식이며, 정규화를 통해 0‑1 구간에 매핑한다.
통계적 검증 단계에서는 IPI와 퀴즈 점수, 포럼 참여도, 과제 제출률 간의 피어슨 상관관계를 분석했으며, 모두 0.35 이상으로 유의미한 양의 상관을 보였다. 이는 클릭 행동이 실제 학습 성과와 연관됨을 실증한다. 이어서 시계열 예측 모델(LSTM, 마르코프 체인)로 다음 클릭을 예측했을 때, 정확도 78%를 달성했으며, 특히 ‘rewind → pause → play’ 패턴이 높은 학습 성취와 연결되는 것이 확인되었다.
프로파일링에서는 k‑means와 계층적 군집화를 적용해 4개의 대표 시청 유형을 도출했다. ① 지속적 심층 시청(높은 IPI, 낮은 skip), ② 선택적 재시청(높은 rewind, moderate IPI), ③ 표면적 스키밍(높은 fast‑forward, 낮은 IPI), ④ 불규칙 탈락형(높은 pause‑skip 비율). 각 군집은 코스 진행률과 최종 탈락률에서 통계적으로 차이를 보였으며, 특히 ③과 ④ 군집이 전체 탈락의 62%를 차지했다.
코스 탈락 예측 모델은 로지스틱 회귀, 랜덤 포레스트, XGBoost를 비교했으며, XGBoost가 AUC 0.86, 정밀도 0.81, 재현율 0.74의 성능을 기록했다. 주요 피처는 IPI 평균, 마지막 동영상 시청 시간, 누적 skip 비율, 그리고 초기 주차의 포럼 활동 여부였다. 변수 중요도 분석 결과, IPI가 가장 큰 영향을 미쳤으며, 이는 클릭 행동 자체가 학습 지속성의 강력한 선행 지표임을 시사한다.
한계점으로는 데이터가 특정 플랫폼(예: Coursera)과 몇 개의 과학·공학 강좌에 국한되어 있어 일반화에 제약이 있다. 또한 IPI 가중치가 전문가 설계에 의존하므로, 다른 문화권이나 학습 스타일에 맞게 재조정이 필요하다. 향후 연구에서는 멀티모달 로그(텍스트, 퀴즈, 토론)와 결합해 종합적인 학습자 모델을 구축하고, 실시간 피드백 시스템에 IPI를 적용해 학습자 맞춤형 개입 효과를 검증할 계획이다.
댓글 및 학술 토론
Loading comments...
의견 남기기