마리아나 해구 형성 요인 비교 분석을 위한 R 스크립트 라이브러리
초록
본 연구는 R 프로그래밍과 GIS를 활용해 마리아나 해구의 지형·지질·해양 환경 요인을 정량적으로 평가한다. 피어슨, 스피어만, 켄달 상관분석 및 correlogram, 상관행렬, 교차상관을 적용해 지형 경사, 퇴적물 두께, 판구조 등 12개 변수를 비교하였다. 결과는 기하학적 경사각, 퇴적물 두께, 판구조가 가장 높은 상관점을 보이며, 특히 판구조와 화산·지진 활동이 해구 형성에 핵심적임을 제시한다.
상세 분석
이 논문은 마리아나 해구라는 극한 환경을 대상으로 다변량 상관분석을 수행한 점에서 학제간 연구 접근법을 잘 보여준다. 우선 데이터 수집 단계에서 해저 지형(bathymetry), 퇴적물 두께, 판구조 경계, 화산 활동 지표, 해수 온도·염도·산소 농도 등 5대 카테고리(지질·지형·해양·기후·지진)로 구분된 12개의 변수셋을 GIS 레이어와 공개된 국제 데이터베이스(예: GEBCO, IRIS, NOAA)에서 추출하였다. 공간 해상도는 1km×1km 격자로 통일했으며, 결측값은 k‑nearest neighbor 보간법으로 처리하였다.
통계 분석에서는 R의 기본 함수와 여러 패키지를 조합했다. 피어슨 상관계수는 stats::cor를, 스피어만·켄달은 Hmisc::rcorr와 psych::corr.test를 이용해 비선형·순위 기반 관계를 탐색했다. 상관행렬 시각화는 corrplot, ggcorrplot, PerformanceAnalytics를 활용했으며, 변수 간 거리 의존성을 파악하기 위해 ncf::correlog를 사용해 공간 correlogram을 작성하였다. 교차상관분석은 ccf 함수를 통해 시간적(또는 깊이축) 지연 효과를 검증했지만, 실제로는 깊이 프로파일을 연속 변수로 전환해 시계열 형태로 가정한 점이 다소 부적절할 수 있다.
결과 해석에서는 피어슨 상관계수가 0.68(경사각‑판구조), 0.62(퇴적물 두께‑판구조) 등 중·고강도 양의 관계를 보였으며, 스피어만·켄달에서도 유사한 순위 상관이 확인돼 비선형 효과가 크게 작용하지 않음을 시사한다. 특히 퇴적물 두께와 화산·지진 활동 지표 간의 켄달 τ값이 0.45로, 순위 기반에서도 의미 있는 연관성을 나타냈다. 그러나 상관분석만으로는 인과관계를 규명하기 어렵다. 변수들 간에 공간 자기상관이 존재할 가능성이 높으며, 이는 Moran's I 검정으로 확인되지 않은 점이 한계로 지적된다.
또한, 상관계수의 통계적 유의성을 p‑값으로만 판단했는데, 다중 비교 보정(예: Bonferroni, FDR) 절차가 누락돼 거짓 양성 위험이 존재한다. 변수 선택 과정에서도 차원 축소(주성분 분석)나 변수 중요도 평가가 선행되지 않아, 상관계수 자체가 실제 모델링에 얼마나 기여하는지 불투명하다.
R 스크립트 구현 측면에서는 재현성을 높이기 위해 renv 혹은 packrat을 이용한 패키지 버전 관리가 언급되지 않았으며, 코드 공유를 위한 GitHub 레포지토리 링크도 제공되지 않았다. 이는 향후 연구자가 동일한 파이프라인을 검증·확장하는 데 장애가 될 수 있다.
전반적으로, R 기반 상관분석과 GIS 통합이라는 방법론은 충분히 설득력 있지만, 공간 통계(예: 공간 회귀, Geographically Weighted Regression), 비선형 모델(Generalized Additive Models), 머신러닝(랜덤 포레스트, XGBoost) 등을 병행한다면 요인 간 복합 효과를 더 정밀하게 파악할 수 있을 것이다.
댓글 및 학술 토론
Loading comments...
의견 남기기