계층형 그래프 트랜스포머 기반 마스크드 BRep 자동인코더
본 논문은 대규모 라벨이 없는 BRep 데이터셋을 활용해 마스크드 자동인코더(MAE)와 계층형 그래프 트랜스포머를 결합한 자기지도 학습 프레임워크를 제안한다. CAD 모델의 면·에지 기하와 속성을 무작위 마스킹한 뒤, 전역‑지역 정보를 교차 주의 메커니즘으로 복원함으로써 강건한 특징 표현을 학습한다. 사전학습된 인코더를 다운스트림 작업(부품 분류, 모델링 세그멘테이션, 가공 특징 인식)에 소량의 라벨만으로 fine‑tuning 하면 기존 방법보…
저자: Yifei Li, Kang Wu, Wenming Wu
본 논문은 CAD 분야에서 핵심적인 데이터 형식인 BRep(경계 표현)의 특성을 그대로 살리면서, 라벨이 부족한 현실적인 상황에 대응하기 위한 자기지도 학습 프레임워크를 제안한다. 저자는 먼저 BRep 모델을 “geometric attributed adjacency graph(gAAG)” 로 변환한다. 여기서 각 면은 노드, 각 에지는 그래프 엣지로 매핑되며, 면·에지 각각에 대해 저해상도와 고해상도 UV 그리드를 샘플링해 기하 정보(좌표, 노멀, 트리밍 인디케이터 등)와 속성(면 유형, 면적, 중심점, 바운딩 박스 등)을 추출한다. 이러한 다중 해상도 특징은 BRep의 극단적인 스케일 변동—예를 들어 넓은 평면과 작은 필렛—을 동시에 포착하도록 설계되었다.
인코더는 두 부분으로 나뉜다. 첫 번째 BRep 인코더는 2D CNN과 MLP를 병렬로 적용해 저·고해상도 기하 특징을 각각 256차원으로 임베딩하고, 속성은 128차원으로 변환한다. 이후 두 해상도 임베딩을 concat하고 MLP를 거쳐 f_low와 f_high라는 두 종류의 노드 특징을 만든다. 에지는 1D CNN+MLP 조합으로 256차원 임베딩 e를 만든다.
핵심 설계인 “Cross‑Scale Mutual Attention(CSMA)” 블록은 저해상도 특징을 쿼리, 고해상도 특징을 키·밸류로 하는 cross‑attention을 수행해 전역 구조를 요약한다. 이어서 self‑attention을 적용해 저해상도 특징을 정제하고, 반대로 저해상도 특징을 쿼리로 사용해 고해상도 특징에 cross‑attention을 적용한다. 이 비대칭적인 정보 흐름은 대규모 평면 영역에서 발생하는 샘플링 중복을 억제하고, 중요한 로컬 디테일을 전역 컨텍스트에 효과적으로 주입한다. 두 개의 CSMA 블록을 순차적으로 쌓아 다중 스케일 통합을 강화한다.
전역 정보를 획득한 뒤, MPNN을 통해 실제 BRep 토폴로지를 반영한 로컬 메시징을 수행한다. 이는 그래프 스무딩에 따른 over‑smoothing 문제를 완화하면서, 면‑면 연결 관계를 정확히 보존한다.
디코더는 두 단계로 구성된다. 첫 단계인 그래프 디코더는 MPNN을 사용해 마스크된 노드·엣지 임베딩을 복원한다. 두 번째 단계인 BRep 디코더는 FoldingNet 기반의 네 개의 병렬 브랜치를 통해 복원된 그래프 특징을 다시 3D 좌표·노멀·트리밍 인디케이터 등 원본 기하 정보와 속성으로 변환한다. 이 단계적 복원 방식은 학습 안정성을 크게 향상시키며, 중간 그래프 특징에 대한 직접적인 손실을 추가함으로써 표현 학습을 더욱 견고하게 만든다.
학습 과정은 MAE(Masked AutoEncoder)와 동일하게, 입력 BRep의 면·에지 기하와 속성을 무작위로 마스킹하고, 마스크된 부분을 복원하도록 네트워크를 훈련한다. 마스크 비율은 실험에서 75% 정도가 최적으로 확인되었다.
대규모 무라벨 BRep 데이터셋(283,018개 모델)으로 사전학습을 진행한 뒤, 다운스트림 작업(부품 분류, 모델링 세그멘테이션, 가공 특징 인식)에 소량의 라벨(0.1%~1%)만을 사용해 fine‑tuning을 수행했다. 결과는 기존 GNN 기반 방법, 단일 레벨 Graph Transformer(BRepFormer), 그리고 최근의 MAE 기반 BRep 모델(Yao et al.)을 모두 크게 앞섰다. 특히 전역‑지역 정보를 동시에 활용한 계층형 설계가 스케일 변동이 큰 CAD 모델에서 높은 일반화 성능을 보이는 주요 원인으로 분석된다.
본 연구의 주요 기여는 다음과 같다. (1) BRep의 연속 기하와 이산 토폴로지를 동시에 보존하는 gAAG 기반 입력 표현; (2) 저·고해상도 특징을 교차 주의로 연결하는 CSMA 블록을 포함한 계층형 그래프 트랜스포머 인코더; (3) 두 단계 디코더를 통한 안정적인 마스크드 복원; (4) 대규모 무라벨 BRep 데이터셋을 활용한 자기지도 사전학습이 제한된 라벨 환경에서도 뛰어난 다운스트림 성능을 달성한다는 실증적 증거. 이러한 접근은 향후 CAD 기반 설계 자동화, 디지털 트윈, 그리고 제조 현장의 AI 적용에 중요한 기반 기술이 될 것으로 기대된다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기