감성 멀티미디어를 위한 핵심 온톨로지 STIMONT 소개

감성 멀티미디어를 위한 핵심 온톨로지 STIMONT 소개

초록

STIMONT은 OWL‑DL 기반의 온톨로지로, W3C EmotionML을 확장하여 감성 멀티미디어 자극의 정서 개념, 고수준 의미, 메타데이터 및 유발된 생리 반응을 형식적으로 기술한다. 기존 감성 데이터베이스의 검색 정확도와 재현율을 향상시키기 위해 설계되었으며, 키워드 기반 검색과 비교한 실험에서 우수한 성능을 보였다. 또한, Intelligent Stimulus Generator라는 도구를 통해 온톨로지 기반 자극 검색 및 시퀀스 구성을 지원한다.

상세 분석

본 논문은 감성 멀티미디어 연구에서 자극 데이터베이스가 직면한 근본적인 문제점을 진단하고, 이를 해결하기 위한 온톨로지 기반 접근법을 제시한다. 기존 데이터베이스는 주로 키워드 태깅에 의존해 왔으며, 정서 라벨링의 주관성, 메타데이터의 불완전성, 그리고 생리적 반응 정보의 부재가 검색 효율을 저해한다는 점을 지적한다. STIMONT은 이러한 한계를 극복하기 위해 OWL‑DL이라는 표현력 높은 논리 기반 언어를 채택하고, EmotionML의 구조를 확장한다. 구체적으로, 정서 개념을 ‘Valence‑Arousal‑Dominance’ 3차원 모델과 기본 감정 카테고리(예: 행복, 분노)로 계층화하고, 고수준 의미(예: 사회적 상황, 문화적 배경)를 ‘Concept’ 클래스로 정의한다. 또한, 자극 자체의 메타데이터(포맷, 저작권, 촬영 장소 등)와 실험 참가자의 생리적 반응(심박수, 피부전도 등)을 ‘Physiology’ 클래스에 연결함으로써, 정서 유발 메커니즘을 온톨로지 수준에서 모델링한다. 이러한 설계는 SPARQL 기반 질의가 가능하도록 하여, 복합적인 조건(예: ‘높은 각성도와 중간 정도의 쾌감, 실내 환경, 심박수 증가’를 보이는 영상)으로 자극을 정확히 추출할 수 있게 한다. 실험에서는 기존 키워드 기반 시스템과 STIMONT 기반 시스템을 동일한 질의 세트에 적용해 재현율과 정밀도를 비교했으며, 온톨로지 방식이 평균 재현율 27%, 정밀도 31% 상승을 기록했다. 이는 정서 라벨링의 일관성 확보와 메타데이터의 구조화가 검색 성능에 직접적인 영향을 미친다는 실증적 증거다. 마지막으로, Intelligent Stimulus Generator는 사용자 인터페이스를 통해 질의를 시각적으로 구성하고, 온톨로지 결과를 기반으로 자동으로 자극 시퀀스를 생성한다. 이는 연구자가 복잡한 실험 설계를 빠르게 구현하도록 돕는 실용적 도구로 평가된다. 전체적으로 STIMONT은 감성 멀티미디어 데이터 관리에 있어 표준화·형식화·자동화라는 세 축을 동시에 충족시키는 혁신적 프레임워크라 할 수 있다.