증가하는 효용 비율을 이용한 고효용 연속 규칙 탐색

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 연속 규칙의 효용 비율이 부모 규칙에 비해 감소하지 않도록 하는 제약을 도입하고, 이를 만족하는 모든 고효용 연속 규칙을 효율적으로 찾는 SRIU 알고리즘을 제안한다. 좌우 확장과 우좌 확장 두 가지 성장 방식, 아이템 쌍 추정 효용(IPEUP) 기반 가지치기, 비트맵 및 압축 유틸리티 테이블 등 다양한 최적화를 통해 탐색 공간을 크게 축소한다. 실험 결과, 기존 HUSRM·US‑Rule 대비 탐색 속도와 메모리 효율이 크게 향상되었으며, 신뢰도와 확신도 지표에서도 우수한 규칙을 도출한다.

상세 분석

SRIU는 “증가하는 효용 비율”(Increasing Utility Ratio, IUR)이라는 새로운 제약을 핵심으로 삼는다. IUR은 규칙 확장 시 효용 비율이 감소하지 않도록 강제함으로써, 확장된 규칙이 실제로 가치를 더하는지 여부를 명확히 판단한다. 이를 구현하기 위해 저자는 두 가지 확장 전략을 제시한다. 좌‑우 확장은 antecedent(전제) 쪽에 아이템을 추가하고 consequent(결론) 쪽은 유지하는 방식이며, 우‑좌 확장은 반대로 consequent에 아이템을 추가한다. 각각의 확장에 대해 별도의 상한선(upper bound)과 가지치기 규칙을 정의함으로써, 불필요한 후보 규칙을 조기에 배제한다. 특히 아이템 쌍 추정 효용 프루닝(IPEUP)은 두 아이템 간 가능한 최대 효용을 미리 계산해, 그 합이 최소 효용 임계값을 넘지 못하면 해당 쌍을 포함하는 모든 규칙을 폐기한다. 데이터 구조 측면에서는 비트맵을 활용해 시퀀스 존재 여부를 압축 저장하고, 규칙별 유틸리티 정보를 담는 컴팩트 유틸리티 테이블을 설계해 메모리 사용량을 크게 줄였다. 실험에서는 실세계 전자상거래·금융·의료 데이터와 합성 데이터셋을 사용해, SRIU가 기존 HUSRM·US‑Rule 대비 평균 2~~5배 빠른 실행 시간과 30~~60% 적은 메모리 사용을 보였으며, confidence와 conviction 지표에서도 더 높은 품질의 규칙을 생성함을 입증한다. 이러한 설계는 규칙 확장 과정에서 효용이 감소하는 모호성을 해소하고, 의사결정에 직접 활용 가능한 가치 증대형 연속 규칙을 제공한다.

증가하는 효용 비율을 이용한 고효용 연속 규칙 탐색

초록

상세 분석

댓글 및 학술 토론

의견 남기기