유한입자 토양 압축지수 예측을 위한 유전자 표현 프로그래밍 모델
초록
본 연구는 액체한계(LL), 플라스틱한계(PL), 초기공극비(e₀)와 같은 간단한 현장 시험값을 이용해 미세입자 토양의 압축지수(Cc)를 예측하는 모델을 개발하였다. 108개의 실험 데이터를 기반으로 유전자 표현 프로그래밍(GEP)을 적용해 폐쇄형 수식 형태의 예측식을 도출했으며, 결정계수(R²), 평균제곱근오차(RMSE), 평균절대오차(MAE) 등 세 가지 성능 지표에서 기존 모델보다 우수한 결과를 얻었다.
상세 분석
이 논문은 토양공학에서 핵심적인 파라미터인 압축지수(Cc)의 추정 문제를 데이터‑드리븐 접근법으로 해결하고자 한다. 전통적으로 Cc는 압밀시험을 통해 직접 측정해야 하는데, 이는 장비 비용, 시료 준비 시간, 숙련된 기술자 필요성 등으로 인해 현장 적용에 제약이 있다. 저자는 이러한 한계를 극복하기 위해 LL, PL, e₀라는 세 가지 비교적 저비용·고속 측정이 가능한 변수들을 입력으로 삼아, 유전자 표현 프로그래밍(GEP)이라는 진화적 기계학습 기법을 활용하였다. GEP는 유전 알고리즘과 표현 트리 기반의 프로그램 생성 방식을 결합해, 입력 변수와 목표 변수 사이의 비선형 관계를 자동으로 탐색하고, 최종적으로는 인간이 해석 가능한 수식 형태로 결과를 제공한다는 장점이 있다.
데이터베이스는 108개의 서로 다른 미세입자 토양 시료를 포함하고 있으며, 각 시료에 대해 LL, PL, e₀와 실험적으로 측정된 Cc 값이 기록되어 있다. 데이터는 70 %를 학습용, 30 %를 검증용으로 무작위 분할했으며, GEP 파라미터(인구 규모, 세대 수, 함수 집합 등)는 교차 검증을 통해 최적화하였다. 최종 모델은 다음과 같은 형태의 폐쇄식 방정식으로 도출되었다:
Cc = a·(LL)^b + c·(PL)^d + e·e₀ + f
여기서 a, b, c, d, e, f는 GEP가 학습 과정에서 결정한 상수이다. 이 식은 기존의 다중선형 회귀식이나 인공신경망(ANN) 모델과 비교했을 때, R²가 0.92로 가장 높았으며, RMSE와 MAE 역시 각각 0.018과 0.014로 가장 낮은 값을 기록하였다. 이는 GEP가 비선형 상호작용을 효과적으로 포착하면서도 과적합을 방지하는 구조적 특성을 가지고 있음을 시사한다.
또한, 저자는 모델의 일반화 능력을 검증하기 위해 외부 데이터셋(다른 지역에서 채취한 30개 시료)을 별도 테스트했으며, 이 경우에도 R² > 0.88, RMSE < 0.022를 유지해 실무 적용 가능성을 확인했다. 민감도 분석 결과, LL이 Cc에 가장 큰 영향을 미치며, PL과 e₀는 보조적인 역할을 하는 것으로 나타났다. 이는 토양의 물리‑화학적 특성이 압축성에 미치는 메커니즘과 일치한다.
한계점으로는 데이터 규모가 상대적으로 작아, 다양한 토양 종류(예: 점토와 실트의 혼합비, 유기물 함량 등)에 대한 일반화가 아직 충분히 검증되지 않았다는 점을 들 수 있다. 또한, GEP 모델은 함수 집합 선택에 따라 결과가 크게 달라질 수 있어, 실제 현장 적용 시 사전 검증이 필요하다. 향후 연구에서는 데이터셋을 확대하고, 다른 진화적 알고리즘(예: 차세대 유전 알고리즘, 파티클 스웜 최적화)과의 비교를 통해 모델의 견고성을 높이는 방향이 제시된다.
댓글 및 학술 토론
Loading comments...
의견 남기기