TLC Plan 두 단계 코드북 기반 벡터 평면도 자동 생성 모델

TLC Plan 두 단계 코드북 기반 벡터 평면도 자동 생성 모델
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

TLC‑Plan은 건물 경계만을 입력으로 받아, 전통적인 래스터‑기반 파이프라인의 벡터화 손실을 없애고, 두 단계의 VQ‑VAE 코드북을 이용해 전역 레이아웃과 세부 폴리곤을 각각 이산화한 뒤, 트랜스포머 기반 자동회귀 디코더가 이를 결합한 CodeTree를 샘플링하여 CAD‑레벨 정확도의 벡터 평면도를 직접 생성한다. RPLAN 데이터셋에서 FID 1.84, MSE 2.06을 기록하며 기존 방법들을 능가한다.

상세 분석

본 논문은 기존 평면도 생성 연구가 래스터 이미지로 학습한 뒤 비선형 벡터화 과정을 거쳐 구조적 불일치와 정밀도 손실을 초래한다는 근본적인 한계를 지적한다. 이를 해결하기 위해 저자는 두 단계 VQ‑VAE(벡터 양자화 변분 오토인코더)를 도입, 전역 레이아웃 레벨에서는 방의 위치·크기·유형을 6‑bit 양자화 후 32‑차원 임베딩으로 변환하고, 폴리곤 레벨에서는 방 경계의 정점 시퀀스를 동일한 구조로 양자화한다. 두 코드북은 EMA(지수 이동 평균) 방식으로 지속적으로 업데이트되어 데이터 분포에 적응하면서도 이산 인덱스의 미분 불가능성을 회피한다.

핵심 아이디어는 “CodeTree”라는 계층적 이산 시퀀스를 정의해, 레이아웃 코드와 각 방의 폴리곤 코드를 순차적으로 연결함으로써 전역‑지역 구조를 하나의 토큰 시퀀스로 압축한다는 점이다. 트랜스포머 기반 자동회귀 디코더는 입력 경계의 특징 벡터와 결합된 조건부 확률 모델을 학습해, Nucleus(top‑p) 샘플링을 통해 다양한 CodeTree를 생성한다. 생성된 CodeTree는 사전 학습된 디코더에 의해 순차적으로 디코딩되어 방의 바운딩 박스와 정밀 폴리곤을 복원하고, 앞문 위치는 정점 순서를 재배열함으로써 자연스럽게 인코딩한다.

학습 단계에서는 마스크드 재구성 손실을 도입해 30‑70%의 입력 토큰을 무작위로 가려, 코드북이 의미 있는 디자인 패턴을 학습하도록 유도한다. 또한 EMD(지구 이동 거리) 기반 재구성 손실과 커밋먼트 손실을 결합해 양자화 오차를 최소화한다. 이러한 설계는 벡터 평면도의 기하학적 정확성을 보장하면서도, 레이아웃 토폴로지나 방 크기와 같은 사전 지식을 요구하지 않는다.

실험에서는 RPLAN과 LIFULL 두 대규모 데이터셋에 대해 FID, MSE, 그리고 기하학적 정밀도(코너 정렬 오차, 면적 오차) 등 다각적인 지표에서 기존 raster‑to‑vector, 그래프 기반, diffusion 기반 모델들을 모두 앞선다. 특히 코드북 크기와 토큰 수를 조절해도 성능 저하가 미미해, 확장성과 실시간 응용 가능성을 입증한다.

결과적으로 TLC‑Plan은 “전역‑지역” 구조를 명시적으로 분리하고, 이산 코드북을 통해 재사용 가능한 디자인 모듈을 학습함으로써, CAD‑레벨 정확도와 다양성을 동시에 만족하는 최초의 엔드‑투‑엔드 벡터 평면도 생성 프레임워크라 할 수 있다. 향후 LLM‑기반 설계 의도 입력이나 건물 외곽선 변형 등과 결합하면, 완전 자동화된 건축 설계 파이프라인 구축에 큰 기여를 할 전망이다.


댓글 및 학술 토론

Loading comments...

의견 남기기