중국어 입력 효율을 측정하는 자동 지표
본 논문에서는 중국어 텍스트 입력을 평가하기 위한 자동화된 지표를 제안한다. 기존의 최소 문자열 거리 오류율, 문자당 키스트로크 수, 수정 비용, 그리고 MacKenzie가 제시한 통합 접근법과 같은 평가 방법들을 중국어 입력의 특수성을 반영하도록 개선한다. 현재의 방법들은 입력 속도와 정확성을 동시에 고려하지 못해 편향이 발생한다는 문제가 있다. 이를 해
초록
본 논문에서는 중국어 텍스트 입력을 평가하기 위한 자동화된 지표를 제안한다. 기존의 최소 문자열 거리 오류율, 문자당 키스트로크 수, 수정 비용, 그리고 MacKenzie가 제시한 통합 접근법과 같은 평가 방법들을 중국어 입력의 특수성을 반영하도록 개선한다. 현재의 방법들은 입력 속도와 정확성을 동시에 고려하지 못해 편향이 발생한다는 문제가 있다. 이를 해소하기 위해 Fitts 법칙과 Hick 법칙을 기반으로 한 새로운 지표인 ‘수정 페널티(Correction Penalty, P)’를 도입하고, 이를 정보 이론의 근사 평균 비용(Approximate Amortized Cost, AAC) 형태로 변환한다. 또한 다양한 문맥 길이를 적용한 중국어 입력 방식들의 AAC를 분석한다.
상세 요약
이 연구는 중국어 텍스트 입력 평가에 있어 기존 지표들이 갖는 근본적인 한계를 짚어낸다. 최소 문자열 거리(Minimum String Distance, MSD) 오류율은 입력 결과와 목표 문자열 사이의 편집 거리를 측정하지만, 중국어와 같이 한 글자가 복합적인 음절·자음·모음 구조를 가지는 경우, 단순 편집 거리만으로는 실제 사용자의 인지·운동 부하를 충분히 반영하지 못한다. 키스트로크당 문자 수(KSPC)는 입력 효율을 나타내지만, 중국어 입력기는 보통 영문 알파벳을 조합해 후보를 선택하는 방식이므로, 후보 선택에 소요되는 시각·인지 비용을 간과한다. 수정 비용(Cost per Correction, CPC)은 오류 수정 시 추가되는 키스트로크를 고려하지만, 오류가 발생했을 때 사용자가 후보 리스트를 탐색하거나 재입력하는 과정을 정량화하지 못한다.
MacKenzie가 제안한 통합 접근법은 속도와 정확성을 동시에 고려하려 했으나, ‘시간당 입력 문자 수(WPM)’와 ‘오류율(ER)’을 단순 가중합으로 결합하는 방식은 중국어 입력 특유의 ‘문맥 길이’와 ‘다중 후보 선택’ 메커니즘을 반영하지 않는다. 예를 들어, 사용자가 2~3음절을 입력해 후보를 제시받고, 이 후보 중 하나를 선택하는 과정은 Fitts 법칙(목표까지 이동 거리와 크기에 따른 움직임 시간)과 Hick 법칙(선택지 수에 따른 의사결정 시간)의 영향을 크게 받는다.
본 논문은 이러한 인지·운동적 요소를 정량화하기 위해 ‘수정 페널티(P)’를 도입한다. P는 Fitts 법칙을 이용해 후보 선택을 위한 마우스·터치 이동 시간을, Hick 법칙을 이용해 후보 수에 비례하는 의사결정 시간을 각각 모델링한 뒤, 이를 합산하여 오류 수정에 소요되는 총 시간을 추정한다. 이 값을 정보 이론의 관점에서 평균 비용으로 환산하면 ‘근사 평균 비용(AAC)’이 된다. AAC는 입력 과정 전체(입력, 후보 탐색, 오류 수정)를 하나의 정보 전송 비용으로 통합해, 속도와 정확성을 동시에 평가한다.
실험에서는 다양한 문맥 길이(예: 1~5음절)를 적용한 중국어 입력기(拼音, 五笔, 手写 등)를 대상으로 AAC를 계산하였다. 결과는 문맥 길이가 길어질수록 후보 수가 감소해 Hick 비용이 감소하지만, 동시에 Fitts 비용이 증가하는 ‘역효과’가 나타남을 보여준다. 이는 최적의 문맥 길이가 존재함을 시사하며, 입력기 설계 시 후보 제시 알고리즘과 UI 배치를 조절해 AAC를 최소화할 수 있음을 의미한다.
이러한 접근은 인간 요인(인지 부하, 움직임 제약)을 수학적으로 모델링함으로써, 평가 결과에 인간 실험자의 주관적 차이가 미치는 영향을 크게 줄인다. 또한, AAC는 기존 지표와 달리 ‘시간당 전송된 정보량’이라는 절대적인 단위로 표현되므로, 서로 다른 입력 방식·플랫폼 간의 공정한 비교가 가능하다. 향후 연구에서는 실시간 로그 데이터를 활용해 동적 P 값을 추정하고, 모바일·데스크톱 환경별 Fitts·Hick 파라미터를 세분화함으로써 더욱 정교한 AAC 모델을 구축할 수 있을 것이다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...