데이터 기반 해석 가능한 퍼지 규칙 베이스 구축 직교 최소제곱법 적용
초록
본 논문은 기존 직교 최소제곱(OLS) 알고리즘을 해석 가능성을 고려하도록 수정하고, 이를 통해 퍼지 규칙 베이스를 자동 생성한다. 수정된 알고리즘은 멤버십 함수의 형태와 규칙 수를 제한해 인간 전문가가 이해하기 쉬운 규칙을 도출한다. 벤치마크 실험과 실제 폐수 처리 결함 탐지 사례에서 제안 방법의 성능과 해석성을 검증하였다.
상세 분석
OLS(Orthogonal Least Squares) 알고리즘은 선형 회귀 기반의 변수 선택 기법으로, 입력‑출력 데이터 집합에서 독립적인 기저 함수를 순차적으로 선택해 모델을 구성한다. 전통적인 OLS는 예측 오차 최소화에만 초점을 맞추어, 선택된 기저 함수(즉, 퍼지 규칙)의 해석 가능성은 고려하지 않는다. 본 논문은 이러한 한계를 극복하기 위해 두 가지 주요 개선점을 도입한다. 첫째, 멤버십 함수의 파라미터를 사전에 정의된 해석 가능한 집합(예: 삼각형, 가우시안, 트라페zo이드 등)으로 제한하고, 각 함수의 중심과 폭을 인간 전문가가 직관적으로 이해할 수 있는 범위로 조정한다. 이를 통해 규칙 전후 관계가 명확히 드러나며, 규칙 수가 과도하게 늘어나는 현상을 방지한다. 둘째, 규칙 선택 단계에서 단순히 잔차 감소량을 기준으로 하는 것이 아니라, ‘해석 점수’를 도입한다. 해석 점수는 규칙의 언어적 단순성(예: 사용된 라벨 수), 멤버십 함수의 겹침 정도, 그리고 규칙 간 중복성을 정량화한 값이다. OLS의 직교화 과정에서 각 후보 규칙의 기여도를 평가할 때, 잔차 감소량과 해석 점수를 가중합하여 종합 점수를 산출한다. 이 가중합은 사용자가 해석성에 부여하고자 하는 중요도에 따라 조정 가능하도록 설계되었다.
알고리즘 흐름은 다음과 같다. (1) 데이터 전처리 후 입력 변수별로 사전 정의된 멤버십 함수 집합을 생성한다. (2) 모든 가능한 퍼지 전제(antecedent) 조합을 후보 규칙으로 만든다. (3) 각 후보 규칙에 대해 OLS 직교화 과정을 수행하면서, 잔차 감소량과 해석 점수를 동시에 계산한다. (4) 종합 점수가 가장 높은 규칙을 선택하고, 선택된 규칙을 모델에 포함시킨 뒤 잔차를 업데이트한다. (5) 사전 정의된 최대 규칙 수 혹은 해석 점수 임계값에 도달할 때까지 3‑4 단계를 반복한다.
실험에서는 두 개의 공개 벤치마크 데이터셋(함수 근사와 비선형 시스템 식별)과 실제 폐수 처리 공정의 결함 탐지 데이터를 사용하였다. 벤치마크에서는 기존 OLS 기반 퍼지 모델과 비교했을 때, 예측 정확도(RMSE)는 2‑3% 정도 감소했지만, 규칙 수는 평균 40% 감소했으며, 각 규칙의 라벨이 명확히 정의돼 전문가가 직접 검증하기 쉬웠다. 실제 폐수 처리 사례에서는 12개의 입력 변수와 1개의 출력(오염 물질 농도)을 대상으로, 제안된 모델이 5개의 핵심 규칙만으로 95% 이상의 탐지 정확도를 달성하였다. 특히, 규칙 “pH가 낮고, 온도가 높으며, 유량이 급증하면 결함 발생”과 같이 직관적인 언어 형태로 표현돼 현장 운영자에게 즉각적인 의사결정 지원을 제공했다.
본 논문의 주요 기여는 OLS 알고리즘에 해석성 평가 메커니즘을 통합함으로써, 데이터 기반 퍼지 규칙 생성 과정에서 인간‑컴퓨터 상호작용을 강화한 점이다. 또한, 규칙 수를 제한하면서도 충분한 예측 성능을 유지하는 트레이드오프를 정량적으로 제시함으로써, 실시간 모니터링 및 제어와 같은 산업 현장에 바로 적용 가능한 프레임워크를 제공한다. 향후 연구에서는 다중 목표 최적화(예측 정확도 vs. 해석성)와 온라인 학습 환경에서의 규칙 업데이트 메커니즘을 탐색할 계획이다.
댓글 및 학술 토론
Loading comments...
의견 남기기