스마트 계약 원자성 위반 탐지를 위한 멀티모달 GCN 프레임워크 AtomGraph
초록
AtomGraph는 스마트 계약의 바이트코드를 제어 흐름 그래프(CFG)와 opcode 시퀀스로 변환한 뒤, 구조적 토폴로지와 의미적 정보를 각각 Node2Vec·Word2Vec으로 추출한다. 적응형 가중치 융합 메커니즘으로 두 모달리티를 동적으로 결합하고, 최종적으로 그래프 컨볼루션 네트워크(GCN)를 이용해 원자성 위반 여부를 판별한다. 실험 결과 96.88% 정확도와 96.97% F1 점수를 달성하며 기존 정적·동적 분석 도구들을 크게 앞선다.
상세 분석
AtomGraph는 스마트 계약 보안 분야에서 원자성 위반이라는 특수한 결함을 고감도·고정밀도로 탐지하기 위해 설계된 멀티모달 딥러닝 프레임워크이다. 먼저, 계약 바이트코드를 EVM 사양에 맞춰 디스어셈블하고, 기본 블록(basic block) 단위로 나눈 뒤, 각 블록 간 점프 관계를 분석해 제어 흐름 그래프(CFG)를 생성한다. 이 과정에서 JUMP, JUMPI, STOP, REVERT 등 제어 흐름 명령을 경계점으로 활용해 정확한 블록 구분을 보장한다.
구조적 모달리티는 Node2Vec을 적용해 CFG의 토폴로지 정보를 임베딩한다. 노드(기본 블록) 간의 연결 패턴, 진입·탈출 차수, 서브그래프 구조 등이 벡터화되어 계약의 흐름 구조를 정량화한다. 의미적 모달리티는 Word2Vec 기반의 Word2Vec을 사용해 각 기본 블록에 포함된 opcode 시퀀스를 학습한다. opcode 간의 연관성 및 실행 의도를 반영한 의미 임베딩은 계약 로직의 세부 동작을 포착한다.
두 임베딩은 L2 정규화 후, 적응형 가중치 융합 단계에서 선형 결합된다. 가중치 α와 β는 (α+β=1) 제약 하에 검증 손실을 최소화하도록 학습되며, 이는 각 모달리티가 현재 데이터셋에서 차지하는 중요도를 동적으로 반영한다. 이 방식은 단순 concatenation 방식보다 6.4% 높은 F1 점수를 기록한다.
융합된 노드 특성은 다중 레이어 Graph Convolutional Network에 입력된다. GCN은 ˜A와 ˜D를 이용해 이웃 정보를 집계하고, 비선형 활성화 σ와 가중치 행렬 W(l)를 통해 깊은 그래프 표현을 학습한다. AdamW 옵티마이저와 동적 학습률 스케줄링, 포커스 손실, 클래스 가중치 조정, 데이터 증강, 드롭아웃·그래디언트 클리핑 등을 결합해 클래스 불균형과 과적합 문제를 완화한다.
실험은 1,880개의 라벨링된 계약(정상 837개, 결함 1,043개)으로 구성된 데이터셋을 90:10 비율로 학습·테스트하였다. AtomGraph는 정확도 96.88%, 재현율 98.27%, 정밀도 96.00%, F1 96.97%, 거짓 양성률 0.05%를 달성했다. 이는 기존 정적 분석 도구(Conkas, Vandal 등)와 동적·하이브리드 도구(Mythril, Osiris 등)의 성능을 크게 앞선 수치이며, 특히 높은 재현율과 낮은 FPR이 실무 적용 가능성을 높인다.
한계점으로는 CFG 생성 시 복잡한 인라인 어셈블리나 옵티마이저에 의해 변형된 바이트코드 처리 비용이 증가할 수 있고, 대규모 계약 풀에 대한 실시간 탐지 성능 평가가 부족하다는 점을 들 수 있다. 향후 연구에서는 멀티체인 지원, 인터컨트랙트 호출 그래프 통합, 그리고 강화학습 기반 탐지 전략을 결합해 탐지 범위와 효율성을 확대할 계획이다.
댓글 및 학술 토론
Loading comments...
의견 남기기