연관 규칙 기반 버그 할당 중복 규칙 제거

연관 규칙 기반 버그 할당 중복 규칙 제거
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 버그 보고서의 심각도, 우선순위, 컴포넌트, 운영체제 정보를 이용해 연관 규칙을 도출하고, K‑means 군집화로 데이터를 분할한 뒤 Apriori 알고리즘으로 상위 5명의 담당자를 예측한다. 중복 규칙을 제거함으로써 기존 방법보다 정확도와 효율성을 향상시켰으며, Mozilla 프로젝트 14,696건의 실제 버그 데이터를 통해 실험을 수행하였다.

상세 분석

이 연구는 버그 트라이애징 과정에서 자동화된 담당자 예측을 목표로 한다. 먼저 전체 버그 데이터셋을 K‑means 군집화 알고리즘으로 여러 클러스터로 분할한다. 군집화는 버그 속성(심각도, 우선순위, 컴포넌트, OS) 간의 유사성을 기반으로 수행되며, 각 클러스터는 상대적으로 동질적인 버그 집합을 형성한다. 이렇게 데이터 규모를 축소하면 Apriori 기반 연관 규칙 마이닝 시 연산 복잡도가 크게 감소한다.

Apriori 알고리즘은 각 클러스터 내에서 빈발 아이템셋을 탐색하고, 이를 토대로 ‘속성 조합 → 담당자’ 형태의 규칙을 생성한다. 여기서 핵심은 중복 규칙을 효과적으로 제거하는 절차이다. 기존 연구에서는 동일하거나 유사한 전제 조건을 가진 다수의 규칙이 동시에 출력되어 해석이 어려웠다. 논문은 지원도(support)와 신뢰도(confidence) 임계값을 조정하고, 전제 조건이 포함 관계에 있을 경우 신뢰도가 높은 규칙만을 남기는 필터링 메커니즘을 도입한다. 결과적으로 각 클러스터별 상위 5명의 담당자를 선정하고, 해당 담당자와 연관된 규칙을 추출한다.

실험은 Mozilla의 Seamonkey, Firefox, Bugzilla 세 프로젝트에서 총 14,696개의 버그 보고서를 사용하였다. 평가 지표는 정확도, 정밀도, 재현율, F1‑score이며, 제안 방법은 기존 단일 모델 기반 할당 기법에 비해 평균 7~12%p의 성능 향상을 보였다. 또한, 군집화와 규칙 중복 제거 단계가 연산 시간을 30% 이상 단축시켰다.

한계점으로는 K‑means 초기 중심점 선택에 따른 군집 품질 변동, Apriori의 후보 아이템셋 폭발 문제, 그리고 담당자 수가 제한적이라는 점을 들 수 있다. 향후 연구에서는 DBSCAN 등 밀도 기반 군집화, FP‑Growth 같은 효율적인 마이닝 알고리즘, 그리고 동적 담당자 풀을 고려한 확장성을 탐구할 필요가 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기