소프트웨어 사용 품질 측정의 현주소와 과제

초록

본 논문은 ISO SQuaRE 시리즈와 기존 품질 모델을 검토하며, 사용 관점에서 소프트웨어 품질을 정량화하기 어려운 이유를 밝힌다. 표준 모델의 복잡성, 맞춤형 모델의 불완전성, 그리고 사용자 리뷰를 활용한 감성 분석을 통한 새로운 예측 방법을 제시한다.

상세 요약

이 연구는 소프트웨어 품질을 ‘품질‑인‑사용(Quality‑in‑Use, QIU)’이라는 개념으로 재정의하고, ISO 25010(이전 ISO 9126)에서 정의한 효율성, 효과성, 만족도, 위험성 네 가지 특성을 중심으로 분석한다. 저자들은 QIU 측정을 위해 필요한 데이터 수집 단계가 현행 표준에서는 지나치게 복잡하고, 실제 현장에서는 사용 로그, 설문, 인터뷰 등 다양한 출처가 혼재한다는 점을 지적한다. 특히, ISO SQuaRE(Software Product Quality Requirements and Evaluation) 시리즈는 품질 특성별 측정 지표와 측정 방법을 제시하지만, 각 지표가 실제 사용자 경험과 어떻게 연결되는지에 대한 구체적 가이드가 부족하다. 이는 기업이 QIU를 정량화하려 할 때, 측정 항목 선택과 가중치 부여 과정에서 주관적 판단에 의존하게 만들며, 결과적으로 신뢰성 있는 품질 점수를 도출하기 어렵게 만든다.

또한, 기존 맞춤형 품질 모델(예: McCall, Boehm, Dromey 등)은 기능적 요구사항 중심으로 설계돼 있어, 사용 환경의 다양성(모바일, 임베디드, 전자정부 등)과 사용자 기대치 변화를 충분히 반영하지 못한다. 이러한 모델들은 종종 ‘품질‑인‑사용’이라는 고차원 개념을 단순히 ‘품질‑특성’으로 축소시켜, 실제 사용자의 만족도와 위험성을 정밀히 측정하는 데 한계를 보인다.

저자들은 이러한 한계를 극복하기 위한 연구 방향으로, 사용자 리뷰와 같은 비정형 텍스트 데이터를 활용한 감성 분석을 제안한다. 리뷰는 사용자가 직접 체감한 효율성, 효과성, 만족도, 위험성을 자연어 형태로 표현하므로, 텍스트 마이닝과 감성 사전 구축을 통해 정량적 품질 지표로 전환할 수 있다. 특히, 최신 딥러닝 기반 언어 모델(BERT, RoBERTa 등)을 활용하면 도메인 특화된 감성 분류와 세부 품질 특성 추출이 가능해진다. 이 접근법은 기존 표준 모델이 요구하는 복잡한 설문 설계와 데이터 수집 과정을 간소화하고, 실시간으로 품질 변화를 모니터링할 수 있는 장점을 제공한다.

하지만 감성 분석에도 한계가 존재한다. 리뷰의 편향성, 언어적 다양성, 그리고 부정확한 라벨링은 모델의 신뢰성을 저하시킬 수 있다. 따라서 저자들은 다중 소스(리뷰, 로그, 설문) 융합, 라벨링 자동화, 그리고 도메인 적응 기법을 결합한 하이브리드 프레임워크를 제안한다. 이러한 프레임워크는 품질‑인‑사용 측정의 정확도와 재현성을 동시에 향상시킬 수 있을 것으로 기대된다.

결론적으로, 논문은 현재 ISO SQuaRE 기반 품질 모델이 실무 적용에 직면한 구조적 복잡성과 맞춤형 모델의 불완전성을 명확히 진단하고, 텍스트 기반 감성 분석을 통한 새로운 예측 방법을 제시함으로써 향후 연구와 산업 현장에 실질적인 로드맵을 제공한다.

초록

상세 요약

📜 논문 원문 (영문)