타임스탬프 네트워크에서 활동 시기 추정 모델
본 논문은 역사적 상호작용 네트워크에서 에이전트별 활동 시기를 추정하기 위한 잠재공간 기반 생성 모델을 제안한다. 각 정점에 숨은 실수형 변수 Zᵢ를 두고, 정점 간 연결 확률을 Zᵢ와 Zⱼ의 차이 제곱에 기반한 로지스틱 함수로 정의한다. 연결된 경우 상호작용 시점 Dᵢⱼ는 Zᵢ와 Zⱼ 사이의 평균을 중심으로 정규분포를 따른다. 최대우도 추정을 통해 Z와 모델 파라미터를 학습하고, 시뮬레이션 실험에서 로컬 평균 대비 평균제곱오차(MSE) 개선을…
저자: Fabrice Rossi (SAMM), Pierre Latouche (SAMM)
본 논문은 역사적 기록에서 에이전트(예: 토지 소유자)의 활동 기간을 직접 알기 어려운 상황에서, 에이전트 간 상호작용이 기록된 타임스탬프만을 이용해 각 에이전트의 “활동 날짜(activity date)”를 추정하는 새로운 생성 모델을 제시한다. 연구 배경으로는 중세 프랑스의 공증 행위 기록과 같이, 토지나 건물의 소유권 이전이 상세히 기록되지만 소유자의 생애 기간은 이름 외에 거의 정보가 없다는 점을 들었다. 이러한 데이터는 그래프 형태로 표현될 수 있으며, 정점은 에이전트를, 에지(연결)는 상호작용을 의미한다. 각 에지는 발생 시점 Dᵢⱼ라는 실수형 타임스탬프를 가지고 있다.
**모델 설계**
- **잠재 변수 Zᵢ**: 각 정점 i에 대해 양의 실수 Zᵢ를 도입한다. Zᵢ는 해당 에이전트의 중심 활동 시기를 의미한다.
- **연결 확률**: 정점 i와 j가 연결될 확률은 Zᵢ와 Zⱼ의 차이 제곱에 기반한 로지스틱 함수로 정의한다. 구체적으로
log P(Aᵢⱼ=1|Zᵢ,Zⱼ,α,β) – log P(Aᵢⱼ=0|Zᵢ,Zⱼ,α,β) = α – β·(Zᵢ–Zⱼ)².
α는 전체 네트워크 밀도를 조절하고, β는 거리(시간 차) 증가에 따른 연결 감소 속도를 조절한다. 제곱을 사용함으로써 미분 가능성을 확보하고, 큰 거리값(≈2500)에서도 수치적 안정성을 유지한다.
- **날짜 생성**: 연결이 존재할 경우, 실제 상호작용 날짜 Dᵢⱼ는 Zᵢ와 Zⱼ의 평균을 평균으로 하는 정규분포 N((Zᵢ+Zⱼ)/2, σ²)에서 샘플링한다. σ는 에이전트의 평균 수명(예: 80년) 대비 변동성을 나타낸다.
**추정 방법**
전체 로그우도는 연결 여부와 날짜 관측치를 독립적으로 다루는 두 부분으로 구성된다. 이를 식 (4)로 정리한 뒤, 파라미터 Z, α, β, σ를 최대우도 추정한다. 초기값은 로컬 평균 ˆZᵢ = Σⱼ Aᵢⱼ Dᵢⱼ / Σⱼ Aᵢⱼ 로 설정하고, α와 β는 전체 밀도와 거리 100년에서의 거의 영(10⁻⁶) 연결 확률을 만족하도록 초기화한다. 경사하강법을 이용해 반복적으로 파라미터를 업데이트한다.
**실험 설계 및 결과**
실제 역사 데이터가 충분히 확보되지 않아 시뮬레이션 데이터를 사용하였다.
1. **이상적 상황**: 모델 자체에 의해 생성된 네트워크(정점 100, Zᵢ는
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기