bayesics: R에서 베이지안 추론으로 “통계 한눈에” 구현하기

읽는 시간: 8 분
...

📝 Abstract

Bayesian statistics is an integral part of contemporary applied science. bayesics provides a single framework, unified in syntax and output, for performing the most commonly used statistical procedures, ranging from one- and two-sample inference to general mediation analysis. bayesics leans hard away from the requirement that users be familiar with sampling algorithms by using closed-form solutions whenever possible, and automatically selecting the number of posterior samples required for accurate inference when such solutions are not possible. bayesics} focuses on providing key inferential quantities: point estimates, credible intervals, probability of direction, region of practical equivalance (ROPE), and, when applicable, Bayes factors. While algorithmic assessment is not required in bayesics, model assessment is still critical; towards that, bayesics provides diagnostic plots for parametric inference, including Bayesian p-values. Finally, bayesics provides extensions to models implemented in alternative R packages and, in the case of mediation analysis, correction to existing implementations.

💡 Analysis

**

1. 연구 배경 및 필요성

  • 베이지안 vs. 빈도주의: 저자는 베이지안 추론이 과학적 질문에 직접적인 답을 제공한다는 점을 강조하며, 빈도주의의 p‑값·신뢰구간 해석 문제를 비판한다. 최근 20년간 credible interval 사용이 급증했음에도 여전히 confidence interval가 주류인 현실을 데이터(유럽 PMC)로 제시한다.
  • 기존 R 패키지의 한계: bayesFactor, DFBA, arm 등은 각각 베이즈 팩터만, 비모수 베이지안, 대규모 정규 근사에 국한돼 있어, 사용자가 필요로 하는 점·구간 추정, ROPE, PDir 등을 동시에 제공하지 못한다.
  • 알고리즘 중심 패키지(rstanarm, brms)는 강력하지만 MCMC 수렴·MCSE에 과도하게 의존하고, 사용자가 실제 추론 정확도를 판단하기 어렵다.

2. 주요 기여

구분기존 패키지bayesics의 차별점
추론량베이즈 팩터·점 추정·비모수 추정 등 제한적점 추정·신뢰구간·PDir·ROPE·베이즈 팩터 전부 제공
알고리즘 투명성사용자가 MCMC 설정·진단 직접 수행폐쇄형 해 우선 사용, 불가능 시 자동 샘플 수 결정(정밀도 기준)
진단 도구기본적인 수렴 진단(R̂) 정도베이지안 p‑값, 다양한 진단 플롯 제공
사용자 친화성모델 정의·샘플링 파라미터 직접 지정 필요통일된 문법 + 최소 입력(정밀도 허용오차)
확장성특정 모델에 특화다른 패키지 모델 연계·매개분석 보정 기능 포함

3. 기술적 구현

  • 폐쇄형 해: 정규·베타·감마 등 표준 사전·우도 조합에 대해 분석적 사후를 제공, 계산 비용 최소화.
  • 자동 샘플링: 사후 분포의 신뢰구간 꼬리 추정에 필요한 샘플 수를 이론적 CLT( Doss et al., 2014) 기반으로 계산, 사용자는 **정밀도 허용오차(ε)**와 **신뢰 수준(s)**만 지정하면 된다.
  • 진단 플롯: posterior predictive check, residual plot, 베이지안 p‑값 히스토그램 등 시각화 도구를 기본 제공.
  • ROPE 자동 스케일링: 공변량 스케일에 따라 기본 ROPE 경계 자동 조정( bayestestR 의 한계 보완).

4. 강점

  1. 추론 중심 설계 – 사용자는 “어떤 결과가 나왔는가?”에 집중할 수 있다.
  2. 알고리즘 자동화 – 초보자도 복잡한 MCMC 튜닝 없이 정확한 추론 가능.
  3. 통합 인터페이스 – 다양한 분석(표본 검정, 회귀, 매개분석 등)을 동일 함수 형태(bayesics::one_sample(), bayesics::regression())로 수행.
  4. 교육·재현성 – 코드가 간결하고 출력이 표준화돼 논문·보고서에 바로 삽입 가능.

5. 약점 및 개선점

약점제언
폐쇄형 해 적용 범위 제한: 다변량·비선형·계층 모델에서는 여전히 MCMC 필요향후 자동 모델 선택(closed‑form vs. MCMC) 로직 강화 및 사용자 경고 메시지 제공
베이즈 팩터 지원 제한: 현재는 베이즈 팩터를 제공하지만, 복잡한 모델(혼합·비선형)에서는 미지원bridgesampling 등과 연동해 베이즈 팩터 자동 계산 옵션 추가
성능 비교 부재: rstanarm·brms와의 시간·정확도 벤치마크가 부족공개 데이터셋을 이용한 성능 프로파일링 및 논문 부록 제공
문서·튜토리얼: 현재 논문 수준 설명에 머무름인터랙티브 vignettes, Shiny 앱 등 실시간 학습 도구 개발
다중 비교·사후 검정: 다중 테스트 보정(예: FDR) 기능이 미포함베이즈 다중 비교 방법(예: Bayesian FDR) 통합 고려

6. 학문·실무적 파급 효과

  • 생명과학·의학: 규제기관·학술지에서 베이지안 결과를 요구하는 추세에 맞춰, 신뢰구간·ROPE·PDir을 한 번에 제공함으로써 논문 작성·심사 과정이 간소화될 전망.
  • 교육: 베이지안 통계 입문 교재에 bayesics를 활용한 실습을 포함하면, “알고리즘은 어떻게 동작하나요?”보다 “결과는 어떻게 해석하나요?”에 초점을 맞춘 교육이 가능해진다.
  • 재현성: 자동 샘플 수 결정과 표준화된 출력은 재현성 위기에 대응하는 강력한 도구가 된다.

7. 결론 및 향후 연구 방향

bayesics베이지안 추론을 알고리즘에서 해방시키고, 핵심 추론량을 일관된 형태로 제공함으로써 R 사용자층을 크게 확대할 잠재력을 가진 패키지이다. 향후 복합 계층 모델, 베이즈 팩터 자동화, 성능 벤치마크 등을 보강한다면, 베이지안 통계의 표준 툴킷으로 자리매김할 수 있을 것이다.


**

📄 Content

한국어 번역 (2000자 이상)

구어체에서 흔히 쓰이듯이, 베이지안 통계는 확률을 불확실성과 동일시한다. 따라서 베이지안 확률의 정의는 특정 진리 혹은 사건에 대한 불확실성(지식의 부족) 정도를 정량화하려는 목적을 가진다. 베이지안 분석은 “내 가설이 참인가?” 혹은 “x와 y 사이에 양의 관계가 존재한다는 것을 얼마나 확신할 수 있는가?”와 같은 과학적 질문에 직접적인 답을 제시함으로써, 바로 해석 가능한 양을 제공한다. 반면에 빈도주의 추론은 해석이 어렵거나 과학적 결론을 도출하기 위해 추가적인 절차가 필요하다. 예를 들어, 신뢰구간은 구체적인 실현된 구간 자체가 아니라 추정 과정에 대해서만 해석을 허용한다. 또 다른 빈도주의 핵심인 p‑값은 “연구 공동체에서 너무 자주 오해되고 남용된다”(Wasserstein & Lazar 2016)고 지적되며, 이는 재현성 위기에 크게 기여했다(Colquhoun 2017). 실제로 Greenland·Senn·Rothman·Carlin·Poole·Goodman·Altman(2016)은 빈도주의 추정치와 절차가 흔히 오해되는 다양한 사례를 열거했으며, 이들 대부분은 베이지안 관점에서는 올바르게 해석될 수 있다.

베이지안 패러다임은 de Finetti, De Groot, Jeffreys, Savage 등 저명한 학자들의 공헌으로 철학적으로 탄탄한 기반을 갖추었다. 이론·계산 모두에서 강력한 토대를 가지고 있으며, 현대 응용 과학·머신러닝(예: Bon, Bretherton, Buchhorn, Cramb, Drovandi, Hassan, Jenner, Mayfield, McGree, Mengersen, Price, Salomone, Santos‑Fernandez, Vercelloni, Wang 2023)에도 깊이 스며들어 있다. 또한 산업계와 정부 규제기관에서도 점차 받아들여지고 있다(Rosner, Laud, Johnson 2021).

Figure 1은 Europe PMC에 색인된 모든 피어‑리뷰 논문 중 “credible interval”(신뢰구간)이라는 구문이 포함된 논문의 비율을 보여준다. 이는 베이지안 추론이 생물의학 연구에서 얼마나 자주 사용되는지를 대략적인 지표(하한)로 삼는다. 2003년경부터 베이지안 추론은 급격히 확산되었지만, 동시에 “confidence interval”(전통적 신뢰구간)의 사용 추세도 여전히 높아, 베이지안 통계가 크게 늘었음에도 불구하고 빈도주의 통계가 생명과학 분야를 여전히 장악하고 있음을 알 수 있다. 이 현상의 원인은 논문의 범위를 넘어선다(저자들은 **Wasserstein & Lazar(2016)**의 서두에서 제시한 “과학과 교육의 순환성”을 지적한다: 규제기관·학술지 편집자는 빈도주의 통계를 기대하고, 그 기대는 빈도주의 교육을 받은 사람들에 의해 지속된다). 반면 베이지안 통계의 사용 증가는 계산 도구의 발달(예: Hagan & West 2010)과 베이지안 방법을 구현한 통계 소프트웨어(예: Štrumbelj 등 2024)의 보급에 크게 기인한다.

특정 작업을 위한 베이지안 추론을 제공하는 R 패키지는 매우 다양하다. 예를 들어, bama(Rix, Kleinsasser, Song 2025)는 고차원 선형 매개 모델에 특화된 베이지안 추론을 수행한다. 반면, greta(Golding 2019), LaplacesDemon(Statisticat & LLC 2021), NIMBLE(de Valpine 등 2017), rstan(Stan Development Team 2025) 등은 모델을 처음부터 구축하고 그 위에서 베이지안 추론을 수행하도록 설계된 고급 패키지이다.

새롭게 개발된 bayesics 패키지(본 원고의 주제)와 가장 밀접한 목적을 가진 패키지는 베이지안 추론 기법을 이용해 흔히 수행되는 일련의 분석을 제공하는 패키지들이다.

패키지주요 기능한계
BayesFactor(Morey & Rouder 2024)ANOVA·선형 회귀·상관(정규분포) 등에 대한 베이지안 가설 검정베이즈 팩터만 제공, 점·구간 추정은 없음
DFBA(Barch & Chechile 2023)비모수 베이지안 방법을 이용한 1·2표본 절차회귀 방법 부재
arm(Gelman & Su 2024)회귀 전용대규모 표본 정규 근사에 의존
rstanarm, brmsStan 기반 회귀·계층 모델자동으로 필요한 추론량을 제공하지 않음(예: MCSE, ROPE)

특히 rstanarmbrms는 회귀 분석에 강력하지만, 알고리즘 수렴 여부만 확인하면 충분하다는 오해를 낳기 쉽다. 실제로 Markov chain이 수렴했는지만으로는 신뢰할 수 있는 추론을 보장할 수 없으며, **Monte Carlo 표준오차(MCSE)**는 점 추정에만 적용돼 구간 추정의 정확성을 판단하기엔 부적절하다. 또한 이들 패키지는 베이지안 분석에 필수적인 베이즈 팩터, PDir, ROPE 등 핵심 양을 자동으로 제공하지 않는다. 최근에는 bayestestR(Makowski·Ben‑Shachar·Lüdecke 2019)가 이러한 기능을 보완했지만, ROPE의 기본 경계가 공변량 스케일에 맞게 자동 조정되지 않는 문제점이 남아 있다.

bayesics 패키지의 목표와 설계

bayesics는 이름 그대로 베이지안 추론을 이용한 가장 흔히 쓰이는 통계 분석을 하나의 통일된 문법·출력 형태로 제공하는 것을 목표로 한다. 제공되는 분석은

  • 단일·두 표본 검정
  • 회귀(모델 평균화, 일반 매개 분석 포함)

등을 포괄한다. Table 1에 전체 기능 목록이 제시되어 있다.

가장 중요한 동기는 알고리즘보다 추론 자체에 초점을 맞추고, 결과 해석·시각화 도구를 제공하는 것이다. “stats::glm()을 어떻게 구현했는지 알 필요 없이, 결과를 올바르게 해석할 수 있다면 충분하다”는 원칙을 베이지안에도 적용하고자 한다. 이를 위해 bayesics

  • 폐쇄형 해법(closed‑form) 혹은 자동 튜닝(사용자 입력 최소화)만을 사용한다.
  • 점 추정보다 구간 추정에 중점을 둔다(예: 95 % credible interval이 0을 포함하지 않으면 ‘통계적으로 유의’하다고 판단).
  • 모델 진단 플롯베이지안 p‑값을 제공해 모델 적합도를 평가한다.
  • 기존 R 패키지와 연동해 매개 분석 등 특수 상황에서도 보정된 방법을 제공한다.

논문의 구성

  • Section 2 – 알고리즘보다 추론·이해에 중점을 둔 설계 철학
  • Section 3 – 모델 진단 플롯·보정 방법
  • Section 4 – 기존 패키지와의 연계·방법 보정
  • Section 5 – 전체 기능 시연
  • Section 6 – 논의

핵심 베이지안 개념 요약

베이지안 통계학자가 일상적으로 사용하는 추론량을 먼저 정리한다(본문 전반에 걸쳐 반복됨).

  1. 점 추정 – 사후 모드, 사후 중앙값, 사후 평균 중 하나를 사용한다. 이들은 의사결정 이론에 근거하지만, 실제로는 “우리의 최선 추정이 틀릴 가능성이 크다”는 점을 인식해야 한다.

  2. 신뢰구간(Credible Interval, CI) – 베이지안에서는 95 % CI가 “진실이 이 구간 안에 있을 확률이 95 %이다”라고 해석한다. 이는 전통적 신뢰구간이 흔히 오해되는 방식과는 근본적으로 다르다(그 오해는 Greenland 등 2016에서 첫 번째로 지적됨).

  3. 방향성 확률(PDir, Probability of Direction) – 회귀 계수가 양(음)일 확률을 나타내며, 관계의 방향을 파악하는 데 유용하지만 실질적 의미(효과 크기)를 판단하기엔 부족하다.

  4. 실질적 동등 영역(ROPE, Region of Practical Equivalence) – 효과가 실질적으로 무시해도 되는 범위를 정의하고, 베이지안 분석은 추정량이 ROPE 안에 있을 확률을 제공한다. Kruschke(2018)의 기본 ROPE 설정을 bayesics는 기본값으로 채택한다.

  5. 베이즈 팩터(Bayes Factor) – 두 경쟁 가설(예: “화학물질 A가 질병 B와 연관된다” vs. “연관되지 않는다”)에 대한 사전·사후 odds 비율을 제공한다.

이러한 양들은 bayesics가 자동으로 계산·제시하도록 설계되었다.


MCMC와 샘플링 정확도

베이지안 추론은 보통 MCMC(Markov Chain Monte Carlo) 샘플링을 통해 사후분포를 근사한다. 따라서 샘플 수정밀도를 이해하는 것이 필수적이다. 일반적으로 사용되는 수렴 진단(Geweke 1991, Gelman‑Rubin 2004)과 **Monte Carlo 표준오차(MCSE)**는 각각 샘플의 유효성점 추정의 정확도를 평가한다. 그러나

  • 수렴 진단만으로는 구간 추정의 정확성을 보장할 수 없다.
  • MCSE는 점 추정에만 적용되며, 구간(특히 꼬리) 추정의 오차를 과소평가한다.

Doss·Flegal·Jones·Neath(2014)는 MCMC 샘플에 대한 중심극한정리를 제시했으며, 이를 이용해 신뢰구간 하한을 원하는 오차 ε와 신뢰도 s로 추정하려면 필요한 샘플 수가 점 평균 추정에 비해 수십 배수백 배 더 필요함을 보였다(그림 2). 실제 시뮬레이션(선형 회귀, 기울기 0.25, 표준편차 1, n = 25)에서 rstanarm을 사용해 500번 반복한 결과, 95 % CI 하한의 경험적 표준오차는 0.0133으로 MCSE(0.00340.0047)보다 3~4배 크게 나타났다.

이 글은 AI가 자동 번역 및 요약한 내용입니다.

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키