모호한 말레이어 단어 식별을 위한 속성 매핑 방법
초록
본 연구는 요구사항 명세와 같은 말레이어 문서에서 흔히 사용되는 모호한 단어를 체계적으로 찾아내기 위해 기존 품질 속성과 문장 규칙을 말레이어에 맞게 재구성하고, 이를 기반으로 모호성 속성을 정의하였다. 정의된 속성에 단어를 매핑한 뒤 언어학 전문가의 검증을 거쳐 120개의 잠재적 모호 단어 목록을 도출하였다.
상세 분석
이 논문은 소프트웨어 요구사항 명세서와 같은 기술 문서에서 의미의 불명확성이 프로젝트 위험을 증대시킨다는 전제 하에, 말레이어 특유의 어휘적·구문적 특성을 고려한 모호성 탐지 프레임워크를 제시한다. 먼저 기존 연구에서 제시된 요구사항 품질 속성(예: 명확성, 일관성, 완전성 등)과 문장 규칙을 리뷰하고, 말레이어에 적용 가능한 형태소 구조와 어휘 다의성을 반영한 새로운 모호성 속성 집합을 설계한다. 주요 속성으로는 ‘다의성’, ‘범위 불명확성’, ‘시간·조건 모호성’, ‘주어·목적어 불명확성’ 등이 포함된다. 이후 말레이어 코퍼스를 구축하고, 빈도와 사용 맥락을 분석하여 후보 단어를 추출한 뒤, 각 후보를 정의된 속성에 매핑한다. 매핑 과정은 자동화된 스크립트와 수동 검토를 병행하여 오류를 최소화하였다. 최종 후보는 말레이어 언어학자 3명의 전문가에게 제시되어, 합의 기반의 검증 절차를 거쳐 120개의 최종 목록으로 확정된다. 연구는 방법론의 재현성을 강조하기 위해 속성 정의표와 매핑 규칙을 공개하고, 향후 다른 언어에도 적용 가능한 일반화 가능성을 논의한다. 한계점으로는 코퍼스 규모가 제한적이며, 전문가 검증이 주관적일 수 있다는 점을 인정한다.
댓글 및 학술 토론
Loading comments...
의견 남기기