하이브리드 적응형 퍼지 극단학습기 기반 텍스트 분류
초록
전통적인 ELM은 이상치와 클래스 불균형에 취약하다. 본 논문은 퍼지 멤버십 함수를 거리와 양자 조화 진동자 기반 밀도로 정의한 HA‑FELM을 제안하고, 텍스트 분류 실험에서 SVM·ELM·RELM보다 우수한 성능을 보였다.
상세 분석
HA‑FELM은 기존 ELM의 빠른 학습 속도와 퍼지 로직의 견고함을 결합한다. 퍼지 멤버십 함수는 두 가지 요소를 동시에 고려한다. 첫 번째는 샘플이 속한 클래스 중심으로부터의 유클리드 거리이며, 거리가 멀수록 멤버십 값이 감소하도록 설계된다. 두 번째는 양자 조화 진동자 모델을 차용한 밀도 추정으로, 동일 클래스 내 샘플 간의 군집 정도를 정량화한다. 이 밀도 값은 고전적인 가우시안 커널보다 더 정밀한 지역 변동성을 포착한다는 점에서 차별화된다. 두 요소를 가중합하여 얻은 적응형 멤버십 값은 학습 단계에서 입력 가중치와 출력 가중치에 곱해져, 이상치가 모델 파라미터에 미치는 영향을 자연스럽게 억제한다. 또한, 멤버십 함수가 데이터 분포에 따라 자동으로 조정되므로 사전 파라미터 튜닝 비용이 크게 감소한다. 실험에서는 20개 이상의 텍스트 데이터셋(뉴스, 리뷰, 트위터 등)에서 10‑fold 교차 검증을 수행했으며, HA‑FELM은 평균 정확도, F1‑score, AUC 모두 기존 SVM, 표준 ELM, 그리고 최근 제안된 RELM보다 2‑5%p 상승했다. 특히 불균형 비율이 1:10 이상인 데이터셋에서 과소표현 클래스의 재현율이 현저히 개선되었다. 이러한 결과는 퍼지 멤버십이 노이즈와 불균형에 대한 내성을 제공함을 실증한다. 그러나 모델 복잡도는 멤버십 계산 단계에서 O(N²) 정도의 추가 연산이 필요해 대규모 실시간 스트리밍 환경에서는 최적화가 요구된다.
댓글 및 학술 토론
Loading comments...
의견 남기기