블랙보드 이용 행태와 학업 성취도 연관성 분석
초록
본 연구는 조지 메이슨 대학교 네트워킹 과목 4개 섹션(총 160명)의 블랙보드 학습관리시스템 로그 데이터를 활용해 학생들의 접속 빈도·시간·콘텐츠 이용 패턴과 중간고사 성적 사이의 상관관계를 조사하였다. 상관분석과 랜덤포레스트 분류모델을 적용한 결과, 토요일 학습 시간이 가장 높은 예측력을 보였으며, 전체 모델 정확도는 77.8%에 달했다.
상세 분석
이 논문은 LMS 로그 데이터를 교육 평가에 직접 연결하려는 시도로서, 데이터 수집·전처리·모델링 전 과정을 비교적 체계적으로 제시한다. 먼저 4개의 강의 섹션에서 59개의 변수를 추출했으며, 결측치가 있는 학생을 제외해 데이터 정합성을 확보하였다. 그러나 결측치 처리 방식을 단순히 삭제로만 한 점은 표본 편향을 초래할 가능성이 있다. 전처리 단계에서 “시간 spent for accessing course content is insignificant”라 판단하고 시간 변수를 배제한 것은 직관적이지만, 시간 자체가 학습 깊이와 몰입도를 반영할 수 있기에 추가적인 변수 변환(예: 로그 변환)이나 상호작용 항을 고려했더라면 더 풍부한 인사이트를 얻었을 것이다.
분석 방법으로는 Pearson 상관계수를 이용해 요일별 학습시간과 점수 간의 선형 관계를 시각화했으며, ‘Saturday’가 가장 강한 양의 상관을 보인 점을 강조한다. 여기서 요일별 시간은 실제 학습량을 대변한다는 가정이 전제되는데, 과제 제출 마감일이 토요일에 집중돼 있거나 강의 일정과 겹치는 경우가 있다면 인과관계가 혼재될 수 있다.
예측 모델은 500개의 트리를 갖는 랜덤포레스트를 사용했으며, OOB 정확도 77.78%와 22.22%의 오류율을 보고한다. 변수 중요도 분석 결과 ‘Saturday’, ‘Tuesday’, ‘Study Guide’, ‘Monday’, ‘Ch4Slides’ 등이 상위에 위치했는데, 이는 요일별 학습 패턴이 성적에 미치는 영향이 강함을 시사한다. 그러나 클래스 불균형(‘0’이 ‘1’보다 많음) 문제를 별도 처리하지 않아 모델이 ‘0’(낙제) 예측에 과도하게 편향될 위험이 있다. 또한 500개의 트리를 사용했음에도 과적합 여부를 검증하기 위한 교차검증 결과가 제시되지 않아 일반화 성능을 판단하기 어렵다.
결과 해석에서는 토요일 학습이 높은 학생이 과제 제출 기한을 맞추거나 주말에 집중 학습을 하는 것으로 해석했지만, 실제 원인 분석을 위해서는 과제 종류·난이도·학생 개인의 시간 관리 습관 등을 추가로 조사해야 한다. 마지막으로 연구 제한점으로 데이터 규모가 작고, 한 과목에 국한된 점을 인정하고 향후 다과목·다기관 데이터를 확보해 모델을 확장할 필요성을 제시한다. 전반적으로 LMS 로그와 학업 성취를 연결하려는 시도는 의미가 크지만, 데이터 전처리·불균형 처리·모델 검증 단계에서 보다 엄격한 방법론을 적용한다면 실용적인 조기 경고 시스템으로 발전할 가능성이 높다.
댓글 및 학술 토론
Loading comments...
의견 남기기