소프트웨어 개발 노력 예측을 위한 라디얼 기저와 일반화 회귀 신경망
초록
본 논문은 COCOMO81 데이터베이스를 이용해 라디얼 기저 신경망(RBFNN)과 일반화 회귀 신경망(GRNN) 기반의 소프트웨어 노력 추정 모델을 개발하고, 기존 Intermediate COCOMO와 비교 평가한다. 다섯 가지 오류 지표(MMRE, MARE, VARE, Mean BRE, Prediction)를 통해 RBFNN이 가장 높은 예측 정확도를 보였음을 보고한다.
상세 분석
소프트웨어 프로젝트 관리에서 노력(노동시간) 추정은 비용, 일정, 인력 배치 등을 결정하는 핵심 활동이며, 초기 단계에서 제공되는 프로젝트 데이터는 종종 불완전하고 잡음이 섞여 있다. 전통적인 COCOMO와 같은 알고리즘 기반 모델은 이러한 불확실성을 충분히 반영하지 못해 추정 오차가 크게 발생한다는 한계가 있다. 이에 본 연구는 인공신경망(ANN)의 비선형 학습 능력을 활용해 불확실한 입력에 대한 강인성을 높이고자 한다.
두 가지 ANN 구조를 선택한 이유는 각각의 특성이 추정 문제에 적합하기 때문이다. 라디얼 기저 신경망(RBFNN)은 입력 공간을 고차원으로 매핑하는 은닉층에 라디얼 기저 함수를 사용하며, 중심(centroid)과 폭(spread) 파라미터를 통해 지역적인 특성을 효과적으로 포착한다. 학습 과정은 일반적으로 k‑means와 같은 클러스터링으로 중심을 초기화하고, 선형 최소제곱법으로 출력 가중치를 구하는 두 단계로 구성되어 빠른 수렴과 과적합 방지에 유리하다. 반면 일반화 회귀 신경망(GRNN)은 확률적 커널 회귀 모델로, 모든 학습 샘플을 기억하고 새로운 입력에 대해 가우시안 커널을 적용해 가중 평균을 계산한다. 파라미터는 스무딩 파라미터(σ) 하나만 조정하면 되므로 구현이 간단하고, 특히 데이터가 적고 잡음이 많은 상황에서 좋은 일반화 성능을 보인다.
실험 데이터는 1981년 COCOMO 데이터베이스(81개 프로젝트)에서 추출했으며, 각 프로젝트는 규모(KLOC), 복잡도, 개발 환경 등 15개의 비용 드라이버와 실제 노력(인·월) 값을 포함한다. 연구자는 데이터를 70 % 학습, 30 % 테스트로 무작위 분할하고, 두 신경망 모두 표준화 전처리를 수행했다. RBFNN의 경우 은닉 뉴런 수를 515개 범위에서 교차 검증으로 최적화했으며, GRNN은 스무딩 파라미터를 0.12.0 사이에서 탐색했다.
성능 평가는 다섯 가지 지표를 사용했다. 평균 절대 상대 오차(MMRE)와 평균 절대 오차(MARE)는 전체적인 추정 정확도를, 평균 변동 절대 오차(VARE)와 평균 상대 오류(MEAN BRE)는 오차 분포의 안정성을, 마지막으로 PRED(25)와 같은 예측률은 일정 허용 오차 내에 들어가는 비율을 나타낸다. 실험 결과, RBFNN은 MMRE = 0.21, MARE = 0.18, VARE = 0.19, Mean BRE = 0.22, PRED(25) = 78 %를 기록해 기존 Intermediate COCOMO(MMRE ≈ 0.35 등)보다 현저히 우수한 성능을 보였다. GRNN도 개선 효과가 있었지만, RBFNN에 비해 과적합 위험이 다소 높아 최적 파라미터 설정에 민감한 점이 드러났다.
이러한 결과는 비선형 모델이 소프트웨어 노력 추정에 내재된 복합 상호작용을 더 잘 포착한다는 점을 시사한다. 특히 RBFNN은 지역적 특성을 반영하면서도 학습 속도가 빠르고, 파라미터 수가 비교적 적어 실무 적용이 용이하다. 그러나 데이터 양이 제한적일 경우 은닉 뉴런 수와 중심 초기화 방법에 따라 성능 변동이 클 수 있으며, 모델 해석 가능성이 낮아 프로젝트 관리자가 결과를 신뢰하기 위해 추가적인 검증 절차가 필요하다. 향후 연구에서는 하이브리드 모델(예: RBF‑GA, GRNN‑PSO)이나 앙상블 기법을 도입해 예측 안정성을 강화하고, 최신 애자일/DevOps 환경의 메트릭을 포함한 대규모 데이터셋으로 일반화 검증을 수행할 계획이다.
댓글 및 학술 토론
Loading comments...
의견 남기기