맞춤형 언어장애 치료를 위한 데이터 마이닝 시스템 모델
초록
본 논문은 어린이 언어장애 치료에 특화된 TERAPERS 시스템과 연계되는 데이터 마이닝 프레임워크를 제안한다. 대량의 치료 기록, 발음 측정값, 진행 상황 등을 통합·분석하여 개인별 최적 치료 경로를 도출하고, 치료 효과를 실시간으로 모니터링한다. 시스템 구조, 핵심 알고리즘, 적용 사례 및 향후 연구 방향을 상세히 기술한다.
상세 분석
이 연구는 기존 언어치료 도구인 TERAPERS에 데이터 마이닝 모듈을 추가함으로써 치료 과정의 과학적 근거를 강화한다는 점에서 의미가 크다. 먼저 데이터 수집 단계에서는 음성 샘플, 치료 세션 로그, 아동의 인구통계학적 정보 등을 표준화된 포맷으로 저장한다. 여기서 중요한 것은 데이터 정제와 결측치 보정 절차를 자동화하여 분석 품질을 확보한 점이다.
다음으로 특징 추출 단계에서는 MFCC, 피치, 지속시간 등 음성 신호 처리 기법을 적용하고, 치료 행동 패턴(예: 연습 빈도, 과제 성공률)과 결합한다. 이렇게 다차원 특징 벡터를 구성한 뒤, 군집화(K‑means, DBSCAN)와 차원 축소(PCA, t‑SNE)를 이용해 아동을 유사 그룹으로 분류한다. 군집 결과는 치료사에게 “유사 발음 오류 유형”이나 “학습 속도”와 같은 인사이트를 제공한다.
예측 모델링에서는 랜덤 포레스트와 Gradient Boosting Machine을 활용해 향후 발음 개선 정도를 예측한다. 모델 학습 시 교차 검증과 과적합 방지를 위한 정규화 기법을 적용했으며, 변수 중요도 분석을 통해 어떤 특징이 치료 성과에 가장 크게 기여하는지 파악한다. 특히, 개인화된 치료 경로를 설계하기 위해 강화학습 기반 정책 최적화 기법을 도입, 각 아동에게 최적의 연습 과제와 난이도를 실시간으로 제안한다.
시스템 구현 측면에서는 클라우드 기반 데이터 웨어하우스와 RESTful API를 이용해 TERAPERS와 원활히 연동한다. 사용자 인터페이스는 치료사가 직관적으로 결과를 확인하고, 치료 계획을 수정할 수 있도록 대시보드 형태로 제공된다. 보안은 GDPR 및 국내 개인정보보호법을 준수하도록 암호화와 접근 제어를 강화하였다.
실험 결과는 120명의 아동 데이터를 대상으로 6개월간 진행했으며, 데이터 마이닝 지원 그룹이 기존 치료 대비 평균 18% 높은 발음 정확도 향상을 보였다. 통계적 유의성 검증(p<0.01)과 효과 크기(Cohen’s d=0.73)도 확인되었다. 다만, 데이터 라벨링 품질과 장기 추적 기간이 제한적이라는 한계가 제시되었다. 향후 연구에서는 멀티모달 센서(시선 추적, 뇌파)와의 융합, 그리고 모델 설명 가능성(XAI) 강화 방안을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기