이더리움 거래 확인 시간 예측: 머신러닝 기반 회귀 모델 비교

이더리움 거래 확인 시간 예측: 머신러닝 기반 회귀 모델 비교
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 이더리움 네트워크에서 거래가 블록에 포함되어 확정되기까지 소요되는 시간을 머신러닝 기법으로 예측한다. 랜덤 포레스트 회귀와 다층 퍼셉트론(MLP)을 기존 통계 회귀 모델과 비교 평가하여, 머신러닝이 더 높은 예측 정확도를 제공함을 입증한다.

상세 분석

이 논문은 블록체인 트랜잭션 처리 지연을 정량화하려는 시도에서 출발한다. 기존 연구들은 주로 가스 가격, 네트워크 혼잡도, 블록 용량 등 몇 가지 변수만을 사용해 선형 회귀나 ARIMA와 같은 통계 모델을 적용했으며, 복잡한 비선형 상호작용을 포착하지 못한다는 한계가 있었다. 저자는 이러한 한계를 극복하기 위해 두 가지 비선형 머신러닝 회귀 모델, 즉 랜덤 포레스트 회귀(Random Forest Regressor, RFR)와 다층 퍼셉트론(Multilayer Perceptron, MLP)을 도입한다. 데이터 수집은 이더리움 메인넷에서 2022년 1월부터 2023년 12월까지의 1백만 건 이상의 트랜잭션 로그를 활용했으며, 주요 피처는 가스 한도, 가스 가격, 트랜잭션 크기, 발신자/수신자 잔액, 최근 블록 평균 가스 사용량, 네트워크 평균 대기 시간, 그리고 시간대와 같은 시계열 특성을 포함한다. 피처 엔지니어링 단계에서 로그 변환, 표준화, 그리고 상호작용 항목을 추가해 모델의 표현력을 강화하였다. 모델 학습은 80% 데이터를 훈련에, 10%를 검증에, 나머지 10%를 테스트에 할당했으며, 하이퍼파라미터 튜닝은 그리드 서치를 통해 수행하였다. 평가 지표는 평균 절대 오차(MAE), 평균 제곱근 오차(RMSE), 결정계수(R²)이며, 통계 회귀 모델(다중 선형 회귀)과 비교했을 때 RFR은 MAE 1.8초, RMSE 2.4초, R² 0.87을 기록했고, MLP은 MAE 1.9초, RMSE 2.5초, R² 0.85를 보였다. 반면 기존 선형 회귀는 MAE 3.6초, RMSE 4.2초, R² 0.62에 머물렀다. 결과는 비선형 모델이 네트워크 혼잡도와 가스 가격 간의 복합적인 관계를 효과적으로 학습함을 시사한다. 또한, 피처 중요도 분석을 통해 가스 가격, 최근 블록 평균 가스 사용량, 그리고 트랜잭션 크기가 예측에 가장 큰 영향을 미치는 것으로 나타났다. 논문은 모델 해석 가능성을 높이기 위해 SHAP 값을 활용했으며, 이는 운영자에게 특정 트랜잭션이 지연될 위험 요인을 직관적으로 제공한다. 한계점으로는 데이터가 특정 기간에 국한돼 있어 계절성 변동이나 프로토콜 업그레이드(예: 이더리움 2.0) 시점의 영향을 충분히 반영하지 못한다는 점을 들었다. 향후 연구에서는 실시간 스트리밍 데이터와 온라인 학습 기법을 결합해 동적 예측 시스템을 구축하고, 다른 블록체인(비트코인, 폴카닷 등)에도 일반화 가능한 모델을 탐색할 계획이다.


댓글 및 학술 토론

Loading comments...

의견 남기기