코드 중심에서 개념 중심으로 NLP 교육 혁신 Vibe Coding 활용
초록
본 논문은 대형 언어 모델(LLM)을 코딩 보조 도구로 활용하면서도 학생들의 개념 이해와 비판적 사고를 강조하는 ‘Vibe Coding’ 교육 방식을 제안한다. 사우디아라비아 King Saud University의 고학년 NLP 과목에 7개의 실습을 적용한 결과, 19명의 학생이 4.4~4.6점(5점 만점)의 높은 만족도를 보였으며, LLM 사용으로 디버깅 부담이 감소해 개념 학습에 집중할 수 있었다. 다만 시간 부족, LLM 출력 검증 어려움, 과제 명세의 명확성 부족 등의 문제점도 제기되었다.
상세 분석
본 연구는 기존 코드 중심 교육이 학생들을 구문 오류와 구현 세부 사항에 몰두하게 만들고, 핵심 NLP 이론 습득을 저해한다는 문제점을 인식하고 ‘Vibe Coding’이라는 새로운 교육 프레임워크를 설계하였다. 프레임워크는 세 가지 핵심 요소로 구성된다. 첫째, 실습 중 LLM 사용을 명시적으로 허용하고 장려함으로써 학생들이 자연어 기반 프롬프트만으로 코드를 생성하도록 유도한다. 둘째, 모든 프롬프트와 LLM 응답을 로그로 기록하도록 의무화해 학생 스스로 프롬프트 설계 과정을 메타인지적으로 반성하게 만든다. 셋째, 평가 방식을 코드 품질 중심에서 개념 이해와 비판적 반성 중심으로 전환한다. 구체적으로 코드 출력 20%, 프롬프트 로그 30%, 반성 질문 50% 비중을 두어 학생들의 사고 과정을 중점적으로 평가한다.
실험은 2025년 가을 학기에 19명의 정보기술 전공 학생을 대상으로 진행되었다. 12주 강의와 7회 실습, 그리고 12주에 걸친 팀 프로젝트(아랍어 PIQA 데이터셋 현지화)로 구성된 커리큘럼을 적용하였다. 실습 주제는 토큰화, POS/NER, 텍스트 분류, N‑gram, 임베딩, 트랜스포머 파인튜닝, 인‑컨텍스트 학습 등 NLP 핵심 영역을 포괄한다. 각 실습마다 학생들은 LLM을 이용해 코드를 생성하고, 프롬프트 로그를 작성한 뒤, 설계 의도·결과 분석·비교 평가 등 고차원 질문에 답하도록 설계되었다.
정량적 설문 결과, 전반적인 강의 만족도(4.68), 이론‑실습 균형(4.58), 개념 자신감(4.00) 등에서 높은 점수를 기록했다. 특히 LLM 활용이 학습 참여도(4.42)와 개념 전달 효과(4.42)를 높였으며, 프롬프트 로그의 유용성은 평균 3.79점으로 다소 편차가 있었지만 전반적으로 긍정적 평가를 받았다. 반성 질문의 공정성(4.21)과 평가 비중 전환의 적절성(4.26) 역시 높은 점수를 얻었다. 그러나 실습 시간 배분에 대한 불만(평균 3.53)과 프로젝트 범위·시간 압박(평균 3.84) 등은 개선이 필요함을 시사한다.
정성적 분석에서는 ‘구현 부담 감소’를 통한 개념 집중, ‘프롬프트 엔지니어링’ 역량 향상, LLM 출력 검증의 어려움, 시간 압박 지속 등 네 가지 주요 테마가 도출되었다. 학생들은 디버깅에 소요되는 인지 부하가 줄어들어 다양한 아이디어를 빠르게 시험하고, 결과를 비교 분석함으로써 이해도가 깊어졌다고 보고했다. 동시에 LLM이 제공하는 답변이 부정확하거나 문맥을 벗어날 경우, 이를 검증하고 수정하는 데 추가적인 노력이 필요했으며, 특히 아랍어 NLP 모델의 성능이 낮아 검증 난이도가 상승했다.
이러한 결과는 LLM을 단순히 코드 자동화 도구로 보는 것이 아니라, ‘프롬프트 설계·출력 평가·반성적 학습’이라는 메타인지 과정을 촉진하는 교육적 매개체로 재구성할 필요성을 강조한다. 또한, 평가 설계에서 코드 품질을 최소화하고 개념적 사고를 중심으로 비중을 재배분함으로써, AI 보조 코딩 환경에서도 학습 목표를 유지할 수 있음을 실증한다. 향후 연구에서는 보다 정량적인 인지 부하 측정, 자동화된 LLM 출력 검증 도구 도입, 그리고 다양한 전공·학년 수준에 대한 적용 가능성을 탐색할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기