연속 활동에서 학습 행동 시퀀스 분석
초록
본 연구는 Mastery Grids 플랫폼의 로그 데이터를 활용해 학생들이 애니메이션 예시, 기본 예시, 파라미터화 연습이라는 세 종류의 연속 활동을 수행할 때 나타내는 행동 패턴을 시퀀스 마이닝과 군집 분석으로 탐색한다. 최소 지원도 4 %와 최대 간격 1을 적용한 SPAM 알고리즘으로 650여 개의 행동 시퀀스를 추출하고, 패턴 안정성을 Jensen‑Shannon 발산 및 코사인 유사도로 검증하였다. 결과는 학생별 행동이 통계적으로 구별 가능함을 보여주며, 두 개의 군집이 각각 파라미터화 연습 중심과 예시 중심의 학습 전략을 나타냄을 확인한다.
상세 분석
본 논문은 교육용 프로그래밍 환경인 Mastery Grids에서 수집된 로그를 기반으로, 학생들의 학습 행동을 연속적인 활동 흐름으로 모델링한다는 점에서 의미가 크다. 먼저 데이터 전처리 단계에서 활동별 소요 시간을 중앙값을 기준으로 이진화(‘이상’/‘이하’)하고, 파라미터화 연습의 경우 정답 여부(P/F)를 추가 라벨로 부여하였다. 이렇게 정의된 시퀀스는 “AnEx p F p”와 같은 형태로 표현되어, 시간적 순서와 정답 정보를 동시에 담는다.
시퀀스 마이닝에는 비트맵 기반의 SPAM 알고리즘을 선택했으며, 최소 지원도(minsup) 4 %와 최대 간격(maxgap) 1을 실험적으로 결정하였다. 이는 전체 44명의 학생이 만든 650개의 시퀀스 중에서 의미 있는 패턴을 추출하기에 충분히 보수적인 설정이다. 최소 패턴 길이를 2로 제한함으로써, 단일 활동에 국한되지 않고 연속된 행동 관계를 포착한다. 결과적으로 15개의 공통 패턴이 도출되었으며, 각 패턴의 발생 빈도는 학생별로 정규화된 후 0.0001의 스무딩 값을 부여해 희소성을 보완하였다.
패턴 안정성 검증에서는 각 학생의 시퀀스를 무작위로 두 부분으로 나누어 내부 거리(self‑distance)와 타 학생과의 거리(distance‑to‑other)를 비교하였다. Jensen‑Shannon 발산과 코사인 유사도 두 가지 대칭 측정값을 사용했으며, 모든 경우에서 self‑distance가 현저히 작아 통계적으로 유의미한 차이가 확인되었다(p < 0.001). 이는 개별 학생의 행동 패턴이 시간에 따라 일관되게 유지된다는 강력한 증거이다.
군집 분석에서는 Ward 방법을 적용한 계층적 클러스터링으로 k = 2인 두 그룹을 도출하였다. 클러스터 1은 파라미터화 연습에 더 많은 시간을 할애하고, 연습을 반복하면서 높은 정답률을 보이는 경향을 보였다. 반면 클러스터 2는 기본 예시와 애니메이션 예시 위주로 학습하며, 파라미터화 연습의 활용도가 낮았다. 이러한 차이는 학습 전략의 다양성을 시각화하고, 향후 맞춤형 학습 지원 시스템 설계에 활용될 수 있다.
전체적으로 논문은 (1) 행동 로그를 시퀀스 형태로 정형화하는 방법, (2) SPAM 기반 시퀀스 마이닝을 통한 공통 패턴 도출, (3) 통계적 거리 측정을 통한 패턴 안정성 검증, (4) 군집 분석을 통한 학습 전략 구분이라는 네 가지 핵심 절차를 제시한다. 다만 데이터 규모가 44명에 불과하고, 추가적인 특성(예: 최종 성적, 사전 지식) 없이 행동만을 기반으로 분석했기 때문에 결과의 일반화에는 한계가 있다. 향후 연구에서는 더 큰 표본과 다양한 학습 성과 지표를 결합해, 행동 패턴이 실제 학업 성취와 어떻게 연관되는지 정량적으로 검증할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기