사용자가 진정 원하는 것을 어떻게 측정할까
초록
이 논문은 “사용자가 실제로 원하는 것”을 행동 기반 ‘참여도’와 동일시하는 문제점을 지적하고, 인지·행동 편향, 시간에 따른 선호 변동 등을 고려한 진정한 선호 측정 방법을 탐구한다. 이를 위해 가상의 기술 기업 ‘Gamaface’ 임원들의 대화를 통해 다양한 철학·경제·심리학적 입장을 제시하고, 최적화 메트릭으로 ‘선호 옵션에 대한 참여도’와 ‘반성 시 후회 정도’를 제안한다.
상세 분석
본 논문은 HCI·AI 분야에서 흔히 사용되는 “참여도(engagement)”를 사용자의 진정한 욕구와 동일시하는 접근법의 한계를 철학적·심리학적 근거를 들어 비판한다. 먼저, 1960년대 Teitelman의 DWIM(Do What I Mean) 개념을 인용해 시스템이 사용자의 의도를 해석하려는 시도가 설계자의 주관적 해석에 머물 수 있음을 지적한다. 이어서 행동주의적 가정—즉 사용자의 행동이 최적 선택을 반영한다는 전제—이 인지 편향(손실 회피, 프레이밍 효과, 하이퍼볼릭 할인 등)과 시간에 따른 선호 변동으로 인해 크게 왜곡될 수 있음을 강조한다. 특히, IRL(Inverse Reinforcement Learning)과 같은 기법이 “진정한 목표 함수”를 추론한다는 가정은 인간이 합리적 의사결정자를 전제로 하는데, 실제 인간은 비합리적·감정적 요인에 크게 좌우된다는 점을 논한다.
논문은 이러한 이론적 배경을 바탕으로 네 명의 가상 인물—Randy(자유주의적 행동주의), Harald(행동경제학), Nichola(덕목·행복주의 윤리학), Sunny(경영진)—의 대화를 구성한다. 각 인물은 다음과 같은 입장을 제시한다. Randy는 “사용자가 선택한 것이 곧 그들의 진정한 욕구”라며 순수 행동 기반 메트릭을 옹호한다. Harald은 시스템 1·시스템 2 이론을 들어 즉각적 보상과 장기적 반성 사이의 갈등을 강조하고, 사용자가 스스로 반성하도록 돕는 인터페이스 필요성을 주장한다. Nichola는 보편적 행복 요인(친밀한 관계, 의미 있는 일, 신체적 건강 등)을 근거로, 과학·철학적 연구 결과를 메트릭에 반영해야 한다고 주장한다.
이 대화를 통해 저자는 “진정한 선호”를 측정하기 위한 두 가지 메트릭을 제안한다. 첫 번째는 “선호 옵션에 대한 참여도”로, 행동 데이터와 실시간 자기보고(1‑10 척도)를 결합해 사용자가 현재 자신의 목표와 일치하는 행동을 하고 있는지를 평가한다. 두 번째는 “반성 시 후회 정도”로, 사용자가 과거에 선택한 행동을 회고했을 때 느끼는 후회의 강도를 측정해 장기적 만족도를 추정한다. 두 메트릭 모두 단순 클릭·시청 시간과 같은 전통적 참여도 지표를 넘어, 사용자의 내적 상태와 시간적 변화를 포착하려는 시도이다.
기술적 구현 측면에서는, 사용자 인터페이스에 무작위 노이즈를 삽입해 탐색적 선택을 유도하고, 베이지안 업데이트를 통해 선호 모델을 지속적으로 갱신한다. 또한, 프라이버시 보호를 위해 개인별 데이터는 로컬에서 익명화된 형태로만 전송하고, 메트릭 가중치는 문화·연령·사회경제적 변수에 따라 동적으로 조정한다. 이렇게 설계된 시스템은 “자율성(autonomy)”과 “복지(well‑being)” 사이의 트레이드오프를 명시적으로 관리함으로써, 기업이 단순 매출·활동량 최적화에서 벗어나 인간 중심의 가치 창출로 전환할 수 있음을 시사한다.
전반적으로 논문은 “무엇을 최적화할 것인가”라는 질문을 기술적·윤리적·철학적 차원에서 재구성하고, 다중 메트릭 기반의 적응형 선호 추론 프레임워크를 제안함으로써 HCI·AI 연구에 새로운 방향성을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기