변수 선택 절차의 거짓 발견율을 추정하는 일반화된 방법
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 라쏘, 전진 단계별 회귀, 그래픽 라쏘 등 다양한 변수 선택 기법에 적용 가능한 거짓 발견율(FDR) 추정기를 제안한다. 충분통계와 라오‑블랙웰리제이션을 이용해 각 변수별 기여를 분해하고, 보수적인(음이 아닌) 편향을 갖는 추정량을 구성한다. 부트스트랩을 통해 표준오차를 평가하며, 시뮬레이션과 실제 데이터에서 교차검증(CV) 곡선과 함께 사용해 예측 정확도와 변수 선택 정확도 사이의 트레이드오프를 시각화한다.
상세 분석
이 연구는 변수 선택 절차의 FDR을 직접 추정하는 새로운 프레임워크를 제시한다. 핵심 아이디어는 전체 FDR을 변수별 기여 FDR_j 의 합으로 분해하고, 각 FDR_j 를 두 개의 인자로 나누어 추정한다. 첫 번째 인자는 “선택 확률 E
댓글 및 학술 토론
Loading comments...
의견 남기기