ChatBCI 대형 언어 모델 기반 P300 스펠러로 문장 입력 효율 혁신
초록
ChatBCI는 P300 기반 스펠러에 GPT‑3.5 API를 연동해 사용자가 입력한 초깃글이나 문맥을 바탕으로 단어와 다음 문장을 예측·제시한다. 새로운 GUI에 제안 단어를 추가 키로 표시하고, SWLDA로 P300을 분류한다. 7명의 피험자를 대상으로 복사‑스펠링과 즉흥 문장 작성 두 과업을 수행했으며, 평균 keystroke 절감 62 %·시간 절감 53 %·ITR 199 % 향상을 달성했다.
상세 분석
본 논문은 기존 P300 스펠러가 문자 단위 선택에 머물러 사용자의 피로와 입력 속도 한계를 초래한다는 문제점을 인식하고, 대형 언어 모델(LLM)의 제로샷 학습 능력을 활용한 예측 입력 방식을 도입하였다. 핵심 기술은 세 가지로 요약된다. 첫째, GPT‑3.5‑turbo API에 대한 원격 질의를 통해 현재까지 입력된 텍스트(예: “I WOULD”)를 프롬프트 템플릿에 삽입하고, 시스템·사용자 역할을 구분해 “다음 단어 후보 10개”를 반환하도록 설계하였다. 프롬프트는 수동 튜닝을 거쳐 다양한 부분 입력에서도 일관된 형식의 후보 리스트를 얻을 수 있게 최적화되었다. 둘째, 이러한 후보 단어를 기존 5 × 8 키보드 매트릭스의 양측에 10개의 추가 키 슬롯으로 시각화함으로써, 사용자는 P300 검출을 통해 문자와 동시에 후보 단어를 선택할 수 있다. 후보 키는 ‘LIKE’, ‘LOVE’ 등 의미적으로 적절한 단어를 제공해, 단어 완성뿐 아니라 문맥 기반 다음 단어 예측까지 수행한다. 셋째, P300 신호는 Stepwise Linear Discriminant Analysis(SW‑LDA)로 실시간 분류한다. 다중 플래시 패턴(행·열 플래시)과 충분한 반복 횟수를 유지하면서도, 후보 단어 선택 시 추가적인 플래시가 필요 없도록 GUI와 신호 처리 파이프라인을 연동하였다. 실험 설계는 두 가지 온라인 과업으로 구성되었다. 과업 1은 사전에 정해진 문장을 복사하도록 요구하며, 과업 2는 피험자가 자유롭게 문장을 즉흥적으로 구성하도록 하여 실제 커뮤니케이션 상황을 모사한다. 7명의 건강한 피험자는 평균 62 %의 keystroke 절감(과업 1)과 80 % 이상의 절감(과업 2)을 달성했으며, 타이핑 속도는 8.53 문자/분이라는 기록적인 수치를 보였다. 정보 전송률(ITR)은 기존 문자‑단위 스펠러 대비 거의 2배에 달했다. 이러한 결과는 LLM 기반 예측이 P300 스펠러의 효율성을 크게 향상시킬 수 있음을 실증한다. 그러나 원격 API 호출에 따른 지연(latency)과 네트워크 의존성, 개인정보 보호 문제, 그리고 GPT‑3.5의 제안이 문맥에 부합하지 않을 경우의 오류 처리 메커니즘 등은 향후 연구에서 보완이 필요하다. 또한, 현재는 10개의 후보만 제공하므로 후보 수 확대와 사용자 맞춤형 프롬프트 자동 생성이 추가적인 성능 향상을 기대한다.
댓글 및 학술 토론
Loading comments...
의견 남기기