패킷 샘플링으로 흐름 통계 복원: 꼬리 재스케일링과 휴리스틱 접근

본 논문은 deterministic 1‑out‑of‑k 패킷 샘플링을 이용해 원본 흐름 크기 분포의 꼬리를 간단히 재스케일링함으로써 복원할 수 있음을 보이고, 작은 흐름에 대한 정보 손실을 보완하기 위해 실제 백본 트래픽에서 얻은 경험적 규칙을 기반으로 한 휴리스틱 방법을 제안한다. 실험 결과는 제안된 방법이 전체 흐름 크기 분포를 정확히 추정함을 확인한다.

저자: Yousra Chabchoub (INRIA Rocquencourt), Christine Fricker (INRIA Rocquencourt), Fabrice Guillemin

패킷 샘플링으로 흐름 통계 복원: 꼬리 재스케일링과 휴리스틱 접근
**1. 서론** 패킷 샘플링은 고속 백본에서 트래픽을 효율적으로 측정하기 위한 표준 기법이며, 가장 널리 쓰이는 방법은 deterministic 1‑out‑of‑k 샘플링이다. 그러나 샘플링된 데이터만으로 원본 흐름 통계를 복원하는 것은 어려운 문제이며, 기존 연구들은 전체 흐름 크기 범위에 대해 정확한 추정 방법을 제시하지 못했다. 본 논문은 이러한 문제를 두 단계로 접근한다. 첫 번째는 큰 흐름(꼬리) 부분을 이론적으로 재스케일링하여 복원하고, 두 번째는 작은·중간 흐름에 대해 경험적 휴리스틱을 도입한다. **2. 샘플링 과정에 대한 가정** - **가정 1 (패킷 독립성)**: 관측 윈도우 Δ 내에서 흐름들의 패킷이 충분히 섞여 있어, 각 패킷이 샘플링될 확률이 흐름 크기 vi 에 비례한다. - **가정 2 (흐름 영구성)**: Δ 동안 흐름이 시작·종료하는 효과를 1차 근사에서 무시하고, 흐름이 영구적으로 존재한다고 본다. 이 두 가정 하에 흐름 i가 샘플링되는 횟수 Si는 Vi·p 번의 베르누이 시행의 합으로 모델링되며, Le Cam의 포아송 근사를 적용한다. **3. 큰 흐름 꼬리 복원 (Proposition 1, 2)** Proposition 1은 샘플링된 흐름 수 Wj 의 평균이 K·Qj 와 차이가 p·E(vi²/Vi) 이하임을 보인다. 여기서 Qj 는 평균 pv 를 갖는 포아송 분포이다. K 가 충분히 크고 위 차이가 무시될 정도이면, 샘플링된 흐름 크기 ˜v 의 분포는 원본 흐름 크기 v 를 p 로 스케일링한 형태와 거의 동일해진다. Proposition 2는 꼬리 영역(j→∞)에 대해 정확히 \

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기