창의적 이미지 제작을 위한 발산·수렴 단계 기반 인간‑AI 협업 프레임워크
📝 원문 정보
- Title:
- ArXiv ID: 2512.18388
- 발행일:
- 저자: Unknown
📝 초록 (Abstract)
생성형 AI는 초보자도 코드·이미지·동영상 등 복잡한 산출물을 만들 수 있게 하며 창작 활동을 민주화하고 있다. 그러나 기존 인터랙션 방식은 사용자가 초기 ‘충분히 좋은’ 결과에 빨리 수렴하고, 이를 넘어서는 탐색에 어려움을 겪어 설계 고착과 조기 수렴을 초래한다. 이를 해결하고자 우리는 Wallas의 창의성 모델에 근거한 발산·수렴 단계가 포함된 구조화된 인간‑AI 공동 창작 패러다임을 제안한다. 초기 발산 단계에서는 고수준 개념 아이디어를 탐색하고, 후반 수렴 단계에서는 저수준 변형을 탐색하도록 설계하였다. 이를 구현한 이미지 공동 창작 시스템 HAIExplore는 (i) 개념 공간을 탐색하는 전용 브레인스토밍 단계로 발산적 사고를 지원하고, (ii) 사용자의 정제 의도를 해석 가능한 파라미터와 옵션으로 외재화하여 정제 과정을 보다 통제 가능하고 탐색하기 쉽게 만든다. 우리는 널리 사용되는 선형 채팅 인터페이스(ChatGPT)와 HAIExplore를 비교한 피험자 내적 실험을 수행하였다. 결과는 창의적 프로세스를 브레인스토밍·정제 단계로 명시적으로 구조화하면 설계 고착을 완화하고, 사용자가 느끼는 통제성·의도 정렬도를 높이며, 비선형적인 창작 작업을 더 잘 지원한다는 것을 보여준다. 마지막으로 향후 창의성 지원 도구와 인간‑AI 공동 창작 워크플로우를 위한 설계 시사점을 제시한다.💡 논문 핵심 해설 (Deep Analysis)
본 연구는 생성형 AI가 제공하는 ‘즉시성’과 ‘다양성’이 오히려 사용자를 초기 결과에 고착시켜 창의적 탐색을 방해한다는 중요한 문제점을 짚어낸다. 기존의 선형 채팅 기반 인터페이스는 사용자가 질문‑응답을 반복하면서 점차 구체적인 프롬프트를 다듬는 방식으로, 이는 전통적인 디자인 프로세스에서 흔히 볼 수 있는 ‘수렴’ 단계만을 강조한다. 결과적으로 사용자는 초기 제시된 이미지가 ‘충분히 좋다’는 판단에 머무르게 되고, 대안적 아이디어를 탐색할 여지를 상실한다. 이러한 현상은 Wallas가 제시한 창의성 4단계(준비‑발산‑수렴‑검증) 중 발산 단계가 충분히 지원되지 않을 때 발생하는 전형적인 ‘조기 수렴(early convergence)’ 문제와 일맥상통한다.HAIExplore는 이론적 배경을 실천적 디자인에 직접 연결한다는 점에서 혁신적이다. 첫 번째 브레인스토밍 단계는 사용자가 키워드, 스타일, 주제 등 고수준 개념을 자유롭게 조합하도록 설계돼, 아이디어의 폭을 넓히는 발산적 사고를 촉진한다. 여기서 중요한 점은 ‘개념 공간’을 외재화하고 시각화함으로써, 사용자가 자신의 사고 흐름을 메타적으로 인식하고 조정할 수 있게 만든다. 두 번째 정제 단계에서는 사용자의 의도를 구체적인 파라미터(예: 색상 톤, 질감, 구도)와 옵션으로 변환해 AI에게 전달한다. 이러한 파라미터화는 ‘해석 가능한 인터페이스’를 제공해, 사용자가 “왜 이 이미지가 이렇게 나왔는가”를 추론하고, 원하는 방향으로 미세 조정할 수 있게 한다.
실험 결과는 두 단계로 구분된 워크플로우가 설계 고착을 현저히 감소시켰으며, 사용자는 자신의 의도와 결과물 간 일치도를 높게 평가했다. 특히 ‘통제감(perceived controllability)’이 향상된 점은, 사용자가 AI를 단순히 도구가 아니라 공동 창작 파트너로 인식하게 만든다는 점에서 의미가 크다. 이는 기존 연구에서 ‘AI‑주도형 생성’이 사용자의 창의적 주체성을 약화시킨다는 비판과 대비된다.
이 논문이 제시하는 설계 시사점은 다음과 같다. 첫째, 창의적 작업을 ‘선형’이 아닌 ‘비선형’ 프로세스로 모델링하고, 단계별 목표와 인터페이스를 명확히 구분해야 한다. 둘째, 사용자의 고차원 아이디어를 구조화된 ‘개념 공간’에 매핑하고, 이를 시각적으로 외재화함으로써 발산적 사고를 촉진한다. 셋째, 정제 단계에서는 사용자의 의도를 파라미터화하고, AI에게 명시적으로 전달함으로써 투명성과 통제성을 확보한다. 넷째, 이러한 구조는 다양한 도메인(텍스트, 음악, 3D 모델링 등)에도 확장 가능하므로, 차세대 인간‑AI 협업 툴 설계에 중요한 원형 모델이 될 수 있다.