자연어 처리 기반 자동 요구사항 분석 도구

자연어 처리 기반 자동 요구사항 분석 도구
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 자연어 처리(NLP)를 활용해 요구사항 문서에서 핵심 객체와 용어를 자동으로 추출·분류하는 프로토타입 시스템을 제안한다. 전처리, 형태소 분석, 명사구 추출, 의미 분류 과정을 거쳐 분석가가 프로젝트에 적합한 용어를 선택하고 검증하도록 지원한다. 작은 사례를 통해 전체 흐름을 시연한다.

상세 분석

이 연구는 소프트웨어 공학에서 요구사항 분석 단계의 비정형 텍스트 처리 문제를 NLP 기술로 해결하고자 한다. 먼저 입력된 요구사항 문서를 토큰화하고 형태소 분석기를 이용해 품사(tag)를 부착한다. 이후 명사구(NP) 추출 규칙을 적용해 잠재적 객체와 속성을 식별하고, 사전 정의된 도메인 어휘집과 비교해 용어의 적합성을 평가한다. 핵심은 ‘객체‑속성‑관계’ 삼중 구조를 자동으로 구성하는데, 이를 위해 의존 구문 분석을 활용해 동사와 명사 사이의 관계를 파악한다. 추출된 용어는 의미론적 클래스(예: 엔터티, 이벤트, 제약조건)로 분류되며, 각 클래스별 신뢰도 점수를 부여한다. 프로토타입 툴셋은 GUI 기반으로, 분석가가 자동 추출 결과를 시각적으로 검토하고 필요 시 수동 수정·추가가 가능하도록 설계되었다. 시스템은 추출·분류 정확도를 검증하기 위해 소규모 요구사항 샘플에 대해 정밀도와 재현율을 측정했으며, 초기 실험에서 78% 이상의 정밀도를 달성했다. 그러나 도메인 어휘집의 품질에 크게 의존하고, 복합 문장이나 비표준 용어 처리에 한계가 있다는 점을 지적한다. 향후에는 기계 학습 기반의 용어 후보 생성 및 대규모 코퍼스 학습을 통해 자동화 수준을 높이고, 다중 언어 지원을 확대할 계획이다.


댓글 및 학술 토론

Loading comments...

의견 남기기