박물관 방문자 경험 모델링을 위한 BIRD 데이터셋
초록
본 논문은 51명의 방문자를 대상으로 눈동자 추적 안경과 실시간 위치 추적을 이용해 수집한 행동·정체성 데이터를 통합한 공개 데이터셋 BIRD를 소개한다. 인구통계, 방문 동기, 피로도 등 설문 정보와 공간·시각 궤적, 시선 데이터, 사후 선호도 평가를 포함해 방문자 프로파일을 전반적으로 재현한다. 데이터셋은 기존 연구에서 다루던 단일 차원 데이터의 한계를 넘어, 맞춤형 전시 경로 추천 및 방문자 유형 군집화에 활용될 수 있다.
상세 분석
BIRD 데이터셋은 문화유산 분야에서 AI 모델링에 필요한 다차원 데이터를 제공한다는 점에서 큰 의의를 가진다. 먼저, 데이터 수집 방법론이 눈동자 추적 안경(Tobii Glasses 2)과 웹 기반 위치 매핑을 결합해 실시간 시선·위치 정보를 고해상도로 기록했다는 점이 주목할 만하다. 100 Hz의 눈동자 샘플링과 2 초 간격으로 정규화된 궤적은 기존 블루투스 비콘이나 RFID 기반 데이터보다 시간·공간 정밀도가 뛰어나며, 관람 중 시선이 머무른 작품을 정확히 식별할 수 있다.
설문 설계는 인구통계, 방문 동기, 피로도, 군중 수용성 등 심리·생리적 변수를 포괄한다. 특히 Falk의 방문자 정체성 모델을 기반으로 한 23개 사전·29개 사후 질문은 방문자의 문화적 배경과 학습 목표를 정량화한다. 이러한 정성·정량 데이터를 하나의 JSON/CSV 구조로 통합함으로써, 연구자는 개별 방문자의 전체 프로파일을 손쉽게 재구성할 수 있다.
데이터 전처리 단계에서는 MovingPandas 라이브러리를 활용해 잡음이 포함된 수동 입력 궤적을 2 초 간격으로 보간·정규화하였다. 이는 속도·정지 횟수·총 이동 거리 등 파생 변수를 일관되게 추출하게 하며, 클러스터링이나 시계열 모델링에 바로 적용 가능하도록 만든다. 표 1에 제시된 전역 특성(방문 시간, 평균 속도, 정지 횟수, 관람 작품 수 등)은 Veron·Levasseur 프로파일을 재현하기 위한 핵심 변수다.
클러스터링 실험에서는 K‑means와 다양한 내부 지표(Elbow, Silhouette, Davies‑Bouldin, Calinski‑Harabasz)를 사용해 4개의 군집이 최적임을 확인하였다. 각 군집은 ‘Grasshopper’, ‘Ant’, ‘Fish’, ‘Butterfly’라는 직관적인 라벨을 부여했으며, 이는 방문자의 이동 속도·정지 패턴·관람 깊이 차이를 반영한다. 이러한 군집은 기존 문헌에서 제시된 방문자 유형과 일치함을 보이며, 데이터셋이 정체성 분석에 충분히 활용 가능함을 입증한다.
한계점으로는 51명이라는 샘플 규모가 아직 제한적이며, 특정 전시관(나시 박물관)과 3층 구조에 국한된 점이다. 또한, 눈동자 추적이 그림에만 적용되고 조각품은 제외된 점은 시선 데이터의 완전성을 저해한다. 향후 연구에서는 참여자 수 확대, 다중 전시관·다양한 문화유산 환경 적용, 그리고 3D 객체에 대한 시선 추적을 포함시켜 데이터의 일반화 가능성을 높여야 한다.
전반적으로 BIRD는 행동·정체성 데이터를 통합한 최초의 공개 박물관 데이터셋으로, 맞춤형 전시 경로 추천, 가상 전시 시뮬레이션, 방문자 경험 평가 등 다양한 AI·HCI 연구에 바로 활용될 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기