딥러닝 기반 헤르미트 가우시안 빔 모달 분해 연구
초록
본 논문은 단일 강도 이미지만으로 헤르미트‑가우시안(HG) 모드의 전력 분포와 위상 정보를 실시간으로 추출하는 딥러닝 기반 모달 분해 방법을 제시한다. 합성 데이터와 실험 데이터를 이용해 훈련된 컨볼루션 신경망이 기존 방법보다 빠르고 비용 효율적이며 잡음에 강인함을 보였다.
상세 분석
본 연구는 광학 분야에서 널리 사용되는 정규 직교 기저인 헤르미트‑가우시안(HG) 모드의 모달 분해(modal decomposition, MD)를 딥러닝으로 구현한 최초 사례라 할 수 있다. 기존 MD 기법은 일반적으로 복합적인 인터페로메트리, 푸리에 변환, 혹은 다중 단계의 최적화 알고리즘을 필요로 하며, 실시간 적용이 어려운 단점이 있었다. 저자들은 이러한 한계를 극복하기 위해 단일 강도 이미지(즉, CCD 혹은 CMOS 센서에 기록된 2‑D 밝기 분포)만을 입력으로 하는 컨볼루션 신경망(CNN) 모델을 설계하였다. 데이터셋은 수천 개의 합성 HG 빔 이미지와 실제 실험으로 얻은 이미지로 구성되었으며, 각 이미지에는 해당 모드 인덱스(m, n)와 전력 비율, 위상 정보가 라벨로 제공된다. 네트워크는 ResNet‑50 기반의 백본에 전역 평균 풀링을 적용하고, 최종 전결합 레이어를 통해 연속적인 전력 비율과 위상 차이를 회귀 출력한다. 손실 함수는 전력 비율에 대한 평균 제곱 오차(MSE)와 위상 차이에 대한 코사인 유사도 손실을 가중합한 형태로, 두 출력이 동시에 최적화되도록 설계되었다. 학습 과정에서는 데이터 증강으로 회전, 스케일 변환, 가우시안 노이즈를 추가해 모델의 잡음 내성을 강화하였다. 실험 결과, 제안된 딥러닝 MD는 1 ms 이하의 추론 시간으로 99 % 이상의 정확도를 달성했으며, 특히 SNR이 10 dB 이하인 저조도 환경에서도 전력 비율 오차가 3 % 미만, 위상 오차가 5° 이하로 유지되었다. 이는 기존의 푸리에 기반 방법이 동일 조건에서 10배 이상 느리게 동작하고, 잡음에 민감해 재구성 품질이 급격히 저하되는 점과 대비된다. 또한, 단일 이미지만으로 전력과 위상을 동시에 복원할 수 있다는 점은 실시간 빔 형성, 레이저 품질 모니터링, 그리고 광공명기 내 교란 분석 등에 직접적인 응용 가능성을 제공한다. 한편, 모델이 훈련된 HG 모드 차수(최대 m+n=6) 이상으로 확장될 경우 성능 저하가 관찰되었으며, 이는 추가적인 고차 모드 데이터와 네트워크 깊이 조정이 필요함을 시사한다. 전반적으로 본 논문은 광학 신호 처리와 인공지능 융합의 새로운 가능성을 제시하며, 향후 다양한 광학 기저(라게르, 라고스 등)와의 일반화 연구가 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기