실용적인 연계 개념 지식 추적 모델 PICKT

실용적인 연계 개념 지식 추적 모델 PICKT

초록

PICKT는 지식 지도와 개념 텍스트를 활용해 다양한 입력 형태를 처리하고, 신규 학생·문제에 대한 콜드 스타트 문제를 효과적으로 해결하는 지식 추적 모델이다. 실제 서비스 환경을 모사한 실험에서 기존 모델 대비 예측 정확도와 안정성이 크게 향상되었으며, ITS 적용 가능성을 입증한다.

상세 분석

PICKT 논문은 지식 추적(Knowledge Tracing, KT) 분야의 실용적 한계를 정확히 짚어낸다. 기존 딥 KT 모델들은 주로 학생‑문제 상호작용 시퀀스만을 입력으로 받아, 질문 텍스트나 개념 간 관계를 활용하지 못한다는 점에서 데이터 활용 효율이 낮다. 특히 신규 학생이 시스템에 처음 등록되거나 새로운 문제·개념이 추가될 때 발생하는 콜드 스타트 현상은 모델 성능을 급격히 저하시키며, 이는 실제 교육 서비스에서 치명적인 장애 요인이다. PICKT는 이러한 문제를 두 가지 축으로 해결한다. 첫째, 지식 지도(Knowledge Map)를 도입해 개념 간의 연관성을 그래프 형태로 명시한다. 이 지도는 질문 텍스트와 개념 설명을 자연어 임베딩으로 변환한 뒤, 의미적 유사도와 전문가 정의 관계를 결합해 구축된다. 둘째, 멀티모달 입력 파이프라인을 설계해 학생‑문제 시퀀스, 질문 텍스트, 개념 텍스트를 동시에 모델에 공급한다. 구체적으로, 시퀀스 데이터는 Transformer 기반의 시간적 인코더에, 텍스트 데이터는 사전학습된 BERT 변형에 입력하고, 두 인코더의 출력을 그래프 신경망(GNN)으로 연결한다. GNN은 지식 지도 위에서 개념 노드의 표현을 전파시켜, 새로운 질문이나 개념이 추가되더라도 기존 노드와의 연결을 통해 의미 있는 초기 임베딩을 제공한다. 이 구조는 콜드 스타트 상황에서도 충분히 풍부한 컨텍스트를 제공함으로써 예측 정확도를 유지한다. 실험 설계는 두 가지 실제 서비스 시나리오를 모사한다. (1) 신규 학생이 기존 데이터가 전혀 없는 상태에서 학습을 시작하는 경우, (2) 기존 데이터에 없던 새로운 문제·개념이 투입되는 경우이다. 각각의 시나리오에서 PICKT는 기존 DKT, AKT, SAKT 등과 비교해 AUC, ACC, RMSE 등 주요 지표에서 평균 5~12%p 향상을 기록한다. 또한 모델의 추론 시간과 메모리 사용량을 측정한 결과, 실시간 서비스 요구사항을 충족할 정도로 효율적임을 확인했다. 안정성 검증을 위해 교차 검증과 시계열 스플릿을 동시에 적용했으며, 데이터 분포 변화에 대한 민감도 분석에서도 낮은 변동성을 보였다. 이러한 결과는 PICKT가 이론적 성능뿐 아니라 운영 환경에서도 견고하게 작동한다는 점을 시사한다. 마지막으로 논문은 PICKT의 한계도 언급한다. 현재는 개념 간 관계를 정적 그래프로 가정하고 있어, 학습 진행 중 관계가 변할 경우 적응이 어려울 수 있다. 또한 텍스트 임베딩에 사용된 사전학습 모델이 도메인 특화되지 않아, 특정 교과 영역에서는 성능 저하가 관찰될 가능성이 있다. 향후 연구에서는 동적 그래프 업데이트와 도메인 맞춤형 언어 모델을 결합해 이러한 제약을 극복하고자 한다.