Seek CAD 로컬 LLM DeepSeek 기반 자기 개선 3D 파라메트릭 CAD 생성 프레임워크
초록
Seek‑CAD는 오픈소스 LLM DeepSeek‑R1을 로컬에서 그대로 활용해 파라메트릭 CAD 코드를 생성하고, 단계별 렌더링 이미지와 체인‑오브‑생각(CoT) 피드백을 VLM에 전달해 자동으로 코드를 정제하는 훈련‑프리 시스템이다. SSR(스케치‑특징‑정제) 삼중 설계 패러다임과 4만 개 규모의 신규 데이터셋을 도입해 복잡한 산업용 모델을 높은 기하학적 충실도로 생성한다.
상세 분석
본 논문은 파라메트릭 CAD 생성이라는 전통적인 설계 히스토리 문제에 LLM과 VLM을 결합한 새로운 접근법을 제시한다. 핵심 아이디어는 ‘훈련‑프리’ 방식으로, 사전 학습된 대형 언어 모델 DeepSeek‑R1‑32B‑Q4를 추가 파인튜닝 없이 그대로 사용한다는 점이다. 이를 위해 저자들은 세 가지 주요 기술적 요소를 설계하였다. 첫째, 로컬 CAD 코드 코퍼스를 구축하고 RAG(Retrieval‑Augmented Generation) 기법을 적용해 입력 텍스트와 가장 유사한 3개의 사례를 검색한다. 검색된 (설명, 코드) 쌍은 시스템 프롬프트와 함께 LLM에 전달되어 초기 CAD 스크립트를 생성한다. 둘째, 생성된 코드를 즉시 파이썬‑OCC와 같은 기하학 커널에 전달해 단계별 투시 이미지(중간 단계와 최종 형태)를 렌더링한다. 이 이미지와 DeepSeek‑R1이 만든 CoT(설계 논리 흐름)를 Gemini‑2.0과 같은 VLM에 입력해 ‘시각‑논리 정합도’를 평가한다. VLM이 부정적인 피드백을 반환하면 해당 피드백을 프롬프트에 삽입해 LLM이 코드를 재생성하도록 하는 자기‑정제 루프가 최대 두 번(k=2)까지 수행된다. 셋째, 기존 SE(스케치‑익스트루전) 패러다임을 넘어 SSR(스케치‑스케치 기반 특징‑정제) 삼중 구조를 도입하였다. SSR은 스케치를 기본으로 하여 익스트루드, 리볼브 등 복합 피처를 정의하고, 필요 시 챔퍼, 필렛, 쉘 같은 정제 피처를 추가한다. 복잡한 형상은 여러 SSR 유닛을 불리언 연산으로 결합한다. 이를 지원하기 위해 ‘CapType’이라는 참조 메커니즘을 설계해 스케치 요소와 파생된 기하학 객체 사이의 명시적 연결을 유지한다. 데이터 측면에서는 4만 개의 SSR 기반 CAD 샘플을 수집·정제하고, 각 샘플에 GPT‑4o가 자동 생성한 자연어 설명을 매핑했다. 데이터셋은 다양한 CAD 명령어와 산업 현장 요구를 포괄하도록 설계돼, LLM이 실제 설계 로직을 학습·추론하는 데 적합하다. 실험에서는 생성된 모델의 기하학적 정확도, 코드 컴파일 성공률, 텍스트‑이미지‑코드 정합도 등 여러 지표에서 기존 3D‑Premise, CADCodeVerify 등과 비교해 유의미한 개선을 보였다. 특히 단계별 시각 피드백을 활용한 자기‑정제 과정이 복잡한 모델에서 오류를 크게 감소시켰으며, 로컬 DeepSeek‑R1만으로도 상용 클로즈드‑소스 LLM(GPT‑4) 수준의 성능을 근접하게 달성했다는 점이 주목할 만하다. 전체적으로 본 연구는 고성능 오픈소스 LLM을 산업 CAD 자동화에 적용하는 실용적인 로드맵을 제시하고, 시각‑언어 피드백 루프가 설계 생성 품질을 어떻게 향상시킬 수 있는지를 실증적으로 증명한다.
댓글 및 학술 토론
Loading comments...
의견 남기기