진화별 질량·연령 예측을 위한 변환기 기반 통합 모델
초록
Gaia XP 저해상도 스펙트럼과 APOGEE DR17 DistMass 라벨을 결합해, 변환기(Transformer) 기반의 기초 모델을 확장하였다. 이 모델은 스펙트럼을 토큰 시퀀스로 처리하여 대기 파라미터(T_eff, log g,
상세 분석
본 연구는 기존의 판별형 머신러닝 모델이 갖는 입력 고정 길이와 결측치 처리의 한계를 극복하기 위해, 변환기(Transformer) 아키텍처를 “기초 모델(foundation model)” 형태로 재구성하였다. 스펙트럼은 Gaia XP의 110개 정규화 계수를 토큰화하고, 색, 파라미터, 소광, 가짜 광도 등 120차원의 입력 벡터에 포함시켰으며, 결측값은 마스킹 메커니즘으로 자동 무시한다. 핵심 혁신은 질량과 연령을 토큰 어휘에 직접 삽입해 연속형 물리량을 고차원 임베딩(128 d)으로 변환한 점이다. 인코더는 2개의 Transformer 블록(1024→512 유닛)과 다중 헤드 셀프‑어텐션(16 heads)으로 관측 토큰 간 상호작용을 포착하고, 디코더는 3개의 블록(3096, 1548, 774 유닛)과 교차 어텐션을 통해 원하는 라벨(예: 질량, 연령)로 매핑한다. 출력층은 값과 표준편차를 동시에 예측하도록 설계돼, 알레아틱 불확실성을 정량화한다. 학습 데이터는 APOGEE DR17의 고해상도 스펙트럼 파라미터와 Gaia XP 스펙트럼, 3D 소광 지도, 위성 거리 정보를 결합한 3.2 × 10⁵개의 별을 사용했으며, 90%를 훈련, 10%를 테스트에 할당했다. 모델은 독립 검증 셋에서 질량 σ≈0.114 M⊙, 연령 σ≈1.334 Gyr의 산포를 보였으며, 질량‑광도 비선형 관계와 소광‑온도 구분을 물리적 사전 지식 없이도 재현했다. 또한 결측된 스펙트럼 구간을 인페인팅하고, 파라미터‑투‑스펙트럼 생성이 가능한 생성적 특성을 보여, 향후 데이터 보강이나 시뮬레이션 기반 검증에 활용 가능하다. 한계로는 훈련 라벨이 DistMass 카탈로그에 의존해 이소크로네 매칭 오류가 전이될 수 있으며, 고대 연령(>10 Gyr) 별에 대한 불확실성이 상대적으로 크다. 전체적으로 변환기 기반 기초 모델이 대규모 저해상도 스펙트럼에서 물리적 일관성을 유지하면서 진화 파라미터를 추정할 수 있음을 입증하였다.
댓글 및 학술 토론
Loading comments...
의견 남기기