퍼소나그램 멀티모달 LLM으로 연결하는 퍼소나와 제품 디자인

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 멀티모달 대형 언어 모델(MLLM)을 활용해 인구통계 기반 퍼소나를 자동 생성·구체화하고, 퍼소나 속성에서 도출된 제품 특징을 시각·텍스트 형태로 연결하는 인터랙티브 시스템 ‘퍼소나그램’을 제안한다. 12명의 전문 디자이너를 대상으로 한 실험에서 기존 챗 기반 퍼소나 도구에 비해 아이디어 탐색 효율, 투명성 인식, 만족도가 크게 향상됨을 보였다.

상세 분석

퍼소나그램은 세 가지 핵심 기술 요소를 결합한다. 첫째, 인구통계·소비자 설문 데이터를 프롬프트에 삽입해 MLLM(GPT‑4V 등)으로부터 고품질, 통계적으로 근거 있는 퍼소나 텍스트를 자동 생성한다. 여기서 ‘속성 필터’ UI는 연령, 소득, 지역 등 구체적 변수들을 슬라이드식으로 조정하게 함으로써 디자이너가 원하는 세그먼트를 즉시 재구성할 수 있다. 둘째, 생성된 퍼소나 속성을 기반으로 ‘제품 레퍼런스 이미지’를 검색·생성한다. 시스템은 텍스트‑투‑이미지 모델에 속성‑키워드(예: “중산층 30대 남성, 친환경 생활”)를 전달하고, 반환된 이미지와 함께 해당 이미지가 함축하는 미학·기능·상징적 의미를 텍스트로 추출한다. 이 과정은 ‘텍스트 → 이미지 → 텍스트 → 이미지’ 순환 파이프라인으로 설계돼, 디자이너가 시각적 영감을 얻은 뒤 다시 텍스트 기반 설계 특징을 정제할 수 있게 한다. 셋째, 추출된 설계 특징(색상, 재질, 형태, 상징적 연관성 등)을 구조화된 리스트 형태로 제공하고, 캔버스 UI에서 자유롭게 조합·재배열·세분화할 수 있게 한다.

연구 설계는 within‑subjects 방식으로, 동일 디자이너가 퍼소나그램과 기존 챗 기반 퍼소나 도구를 각각 사용하도록 하였다. 주요 측정 항목은 (1) 아이디어 탐색 시간, (2) 프롬프트 재작성 횟수, (3) 퍼소나‑제품 연계 인게이지먼트 빈도, (4) 시스템 투명성 인식, (5) 전반적 만족도이다. 결과는 퍼소나그램 사용 시 평균 탐색 시간이 27% 감소하고, 프롬프트 재작성 횟수가 43% 감소했으며, 투명성·만족도 점수가 모두 통계적으로 유의하게 높았다(p < 0.05).

핵심 인사이트는 다음과 같다. 첫째, 멀티모달 LLM을 활용해 텍스트와 이미지를 순환시키는 파이프라인이 ‘추상적 퍼소나 → 구체적 설계 특징’ 변환을 자연스럽게 만든다. 둘째, UI‑레벨에서 속성 필터와 디자인 피처 리스트를 제공함으로써 디자이너가 사고를 구조화하고, 자유롭게 재조합할 수 있는 ‘디자인 탐색 공간’이 확장된다. 셋째, 통계 기반 퍼소나 생성은 비용·시간 절감 효과를 제공하면서도, 실제 사용자 데이터와의 근접성을 유지한다. 마지막으로, 실험 결과는 기존 챗 기반 접근이 대화 흐름에 의존해 설계 사고를 외재화하는 반면, 퍼소나그램은 시각·텍스트 양쪽을 동시에 활용해 인지 부하를 분산시키고, 설계 의사결정의 근거를 명시적으로 보여줌으로써 투명성을 높인다는 점을 시사한다.

한계점으로는 (1) 현재 시스템이 미국 인구통계에 최적화돼 있어 비서구 시장에 적용하려면 데이터 프롬프트와 모델 파인튜닝이 필요하고, (2) 생성된 이미지의 저작권·품질 문제가 여전히 존재하며, (3) 12명이라는 비교적 작은 샘플 규모와 단일 도메인(소비재) 실험으로 일반화에 제한이 있다. 향후 연구에서는 다문화·다언어 지원, 실시간 협업 기능, 그리고 설계 결과물(프로토타입)까지 연결하는 엔드‑투‑엔드 파이프라인 구축이 제안된다.

퍼소나그램 멀티모달 LLM으로 연결하는 퍼소나와 제품 디자인

초록

상세 분석

댓글 및 학술 토론

의견 남기기