그룹 이론 기반 강화학습으로 설계하는 최적 동적 디커플링 시퀀스

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 양자 비트의 위상 탈동조화를 최소화하기 위해, Thompson 군 F의 생성자를 행동 집합으로 활용한 강화학습(RL) 에이전트를 제안한다. 모델‑프리 DDQ‑N( Double Deep Q‑Network) 알고리즘을 이용해 제한된 펄스 수와 측정 횟수만으로도 최적의 펄스 타이밍을 학습하며, 잡음 스펙트럼을 사전에 알 필요가 없고 비가우시안·펄스 오류와 같은 비모델링 효과에도 강인함을 보인다.

상세 분석

이 연구는 동적 디커플링(DD) 최적화 문제를 “순차적 의사결정 과정”으로 정형화하고, 상태를 현재 펄스 시퀀스로, 행동을 펄스 타이밍 전체를 변환하는 함수로 정의한다. 핵심은 행동 집합을 Thompson 군 F의 네 개 생성자( x₀, x₁, x₀⁻¹, x₁⁻¹)와 항등함수로 구성한 점이다. 군 F는 구간

그룹 이론 기반 강화학습으로 설계하는 최적 동적 디커플링 시퀀스

초록

상세 분석

댓글 및 학술 토론

의견 남기기