온라인 학습 환경에서 학생 행동 분석 데이터 마이닝 활용
초록
본 연구는 412명의 대학생이 비채점·채점 온라인 강좌에서 보인 접근 로그를 K‑Means 군집화로 분석하여, 학습 환경에 따른 행동 유형을 다섯 그룹으로 구분하고, 40% 이상이 수동적 학습자임을 확인하였다.
상세 분석
본 논문은 교육 데이터 마이닝(EDM)의 실용적 적용 사례로, 온라인 학습 플랫폼에서 수집된 로그 데이터를 정량적으로 해석한다는 점에서 의미가 크다. 연구자는 412명의 학생을 대상으로 비채점(NG)과 채점(G) 두 종류의 강좌에서 발생한 접속 기록을 수집했으며, 각 기록을 ‘접속 횟수’, ‘접속 지속 시간’, ‘주당 접속 빈도’ 등 여러 파라미터로 정규화하였다. 이후 K‑Means 군집화를 적용해 최적의 군집 수(k=5)를 선정했으며, 실루엣 점수와 엘보우 방법을 병행해 군집의 타당성을 검증하였다.
군집 결과는 NG와 G 각각에서 최소 접근 그룹(NG‑41%, G‑42%)과 최대 접근 그룹(NG‑9%, G‑5%)을 명확히 구분하였다. 특히, 최소 접근 그룹은 전체 학습 활동이 현저히 낮아 ‘수동형 학습자’로 정의되었으며, 이는 전체 학생의 40% 이상을 차지한다는 점에서 온라인 교육의 참여 저조 문제를 드러낸다. 반면, 최대 접근 그룹은 강의 자료를 반복적으로 조회하고, 과제 제출 기한에 맞춰 활발히 활동하는 ‘능동형 학습자’로 파악되었다.
흥미로운 점은 동일 학생 집단이라도 학습 환경(채점 여부)에 따라 행동 패턴이 변한다는 것이다. 예를 들어, 일부 학생은 NG에서는 낮은 접근 빈도를 보였지만 G에서는 급격히 증가하는 ‘동기 부여 효과’를 나타냈다. 이는 평가 요소가 학습 참여를 촉진한다는 기존 교육 심리학 이론과 일맥상통한다. 반대로, 일부 학생은 G에서도 낮은 접근을 유지했으며, 이는 개인의 내재적 동기 부족이나 외부 요인(시간 제약 등)과 연관될 가능성이 있다.
방법론적 측면에서 K‑Means는 군집 형태가 구형이라고 가정하는 한계가 있지만, 본 연구는 사전 데이터 전처리와 표준화를 통해 이러한 제약을 최소화하였다. 또한, 군집 수 결정에 있어 다중 기준을 적용한 점은 결과의 신뢰성을 높였다. 그러나 로그 데이터만으로는 학습자의 인지적·정서적 상태를 완전히 파악하기 어려우며, 설문조사나 인터뷰와 같은 정성적 자료와의 결합이 필요하다.
결론적으로, 이 연구는 온라인 학습 환경에서 학생 행동을 데이터 기반으로 분류함으로써, 교육 설계자가 ‘수동형’과 ‘능동형’ 학습자에 맞는 맞춤형 개입 전략을 수립할 근거를 제공한다. 향후 연구에서는 군집 특성에 따른 학업 성취도 차이를 분석하고, 강화 학습이나 추천 시스템을 도입해 실시간으로 학습 동기를 유발하는 방안을 모색할 수 있다.