불완전 정보 기반 삼중 의사결정의 새로운 패러다임

초록

삼중 의사결정은 분류 규칙이나 의사결정 규칙을 학습하기 위해 거친 집합 이론과 결합되어 널리 활용되고 있다. 완전 정보를 전제로 한 기존 접근법은 등가관계에 기반한 계산적 형식과 논리식의 만족도에 기반한 개념적 형식이라는 두 가지 상보적인 형태로 잘 정립되어 있다. 본 논문에서는 이러한 두 형식을 간략히 검토한 뒤, 실제 적용에서 보다 실용적인 불완전 정보를 다루는 삼중 의사결정으로 일반화한다. 계산적 형식에서는 등가관계를 일반화한 새로운 객체 유사도 정도 측정을 제안하고, 이를 기반으로 α‑유사도 클래스와 객체의 근사가능성 두 가지 접근법을 논의한다. 개념적 형식에서는 완전 정보 하의 만족도를 정량화한 만족도 정도 측정을 제안하며, 이를 토대로 α‑의미 집합과 공식 신뢰도 두 가지 접근법을 연구한다. 유사도 클래스를 이용한 방법은 기존 문헌에서 흔히 사용되는 반면, 제안된 근사가능성 개념과 개념적 형식의 두 접근법은 새로운 연구 방향을 제시한다.

상세 요약

본 연구는 삼중 의사결정(Three‑Way Decision, TWD)이라는 프레임워크를 불완전 정보(incomplete information) 상황에 적용함으로써, 기존의 완전 정보 기반 방법론이 갖는 한계를 극복하고자 한다. 전통적으로 TWD는 거친 집합 이론(rough set theory)과 결합되어 ‘확정(positive)’, ‘부정(negative)’, ‘보류(boundary)’의 세 영역으로 객체를 구분한다. 이때 등가관계(equivalence relation) 혹은 논리식의 만족도(satisfiability)와 같은 이산적 기준이 사용되어, 모든 속성값이 명확히 정의된 완전 데이터에만 적용 가능했다. 그러나 실제 데이터베이스, 센서 네트워크, 의료 기록 등에서는 결측치, 불확실성, 모호성이 빈번히 발생한다. 따라서 ‘얼마나 비슷한가( similarity )’ 혹은 ‘얼마나 만족스러운가( satisfaction )’를 정량적으로 평가할 수 있는 메커니즘이 필요하다.

첫 번째 기여는 등가관계를 일반화한 유사도 정도 측정(similarity degree) 를 도입한 점이다. 이는 두 객체 사이의 거리 혹은 겹침 정도를 0과 1 사이의 실수값으로 표현함으로써, 전통적인 ‘같다/다르다’ 이분법을 넘어선 연속적인 유사성 스펙트럼을 제공한다. 이 기반 위에서 저자는 α‑유사도 클래스(α‑similarity class)를 정의한다. α는 사전에 정해진 임계값으로, 객체가 특정 클래스에 속하기 위해서는 해당 클래스와의 평균 유사도가 α 이상이어야 한다. 이러한 접근은 기존의 ‘동일 클래스에 속한다’는 강제적 조건을 완화시켜, 결측값이 존재하거나 속성값이 부분적으로만 알려진 경우에도 의미 있는 군집화를 가능하게 한다.

두 번째로 제시된 근사가능성(approximability) 개념은 객체가 어느 정도까지 ‘근사적으로’ 특정 결정 영역에 포함될 수 있는지를 정량화한다. 이는 기존의 하위 근사(lower approximation)와 상위 근사(upper approximation)를 연속적인 함수 형태로 확장한 것으로, 각 객체마다 근사가능성 점수를 부여한다. 이를 통해 경계 영역(boundary region)의 크기를 동적으로 조절하고, 의사결정자의 위험 선호(risk preference)에 따라 보류 영역을 축소하거나 확대할 수 있다. 특히, α‑유사도 클래스와 근사가능성을 결합하면, ‘높은 유사도 + 높은 근사가능성’인 객체는 확정 영역으로, ‘낮은 유사도 + 낮은 근사가능성’인 객체는 부정 영역으로 자동 분류되는 다중 기준 의사결정 체계가 구축된다.

개념적 형식에서는 만족도 정도(satisfiability degree) 를 도입한다. 이는 논리식이 부분적으로만 충족될 때도 그 정도를 0~1 사이의 값으로 나타내어, 전통적인 ‘만족/불만족’ 이분법을 넘어선다. α‑의미 집합(α‑meaning set)은 특정 만족도 임계값 α 이상을 만족하는 공식들의 집합으로 정의되며, 이는 불완전한 규칙 기반 시스템에서 신뢰할 수 있는 규칙을 추출하는 데 유용하다. 또한, 공식 신뢰도(confidence of formulas) 를 도입해 각 규칙이 실제 데이터에 얼마나 일관되게 적용되는지를 정량화한다. 이는 베이지안 확률이나 퍼지 이론과 유사한 개념이지만, 거친 집합의 근본적인 ‘불확실성’ 구조와 자연스럽게 결합될 수 있도록 설계되었다.

이러한 두 축(계산적·개념적) 모두 기존 문헌에서 ‘유사도 클래스’를 이용한 불완전 정보 처리 방법을 확장하면서도, 근사가능성과 공식 신뢰도라는 새로운 차원을 도입했다는 점에서 학술적 의의가 크다. 특히, 실험적 검증이 아직 제시되지 않았지만, 제안된 프레임워크는 의료 진단(불완전한 증상 데이터), 금융 사기 탐지(부분적인 거래 기록), 스마트 팩토리(센서 결측) 등 다양한 도메인에 적용 가능할 것으로 기대된다. 향후 연구에서는 제안된 유사도 및 만족도 측정 방법의 구체적 정의(예: 거리 함수, 가중치 설정)와 실험을 통한 성능 평가, 그리고 다중 임계값 α를 동적으로 학습하는 메커니즘을 탐구함으로써, 이론적 모델을 실용적인 의사결정 지원 시스템으로 전환할 수 있을 것이다.

초록

상세 요약

📜 논문 원문 (영문)