프랙탈 다양성을 이용한 데이터 상관성 측정 및 SNR 기반 집단 효과 분석
초록
본 논문은 1차원 데이터 집합에 대해 Cantor 먼지 프랙탈 구조를 활용한 신호‑대‑잡음 비(SNR) 계산 알고리즘을 제시한다. 제안된 SNR은 선형 변환 및 재정규화 군 변환에 불변이며, 데이터 간 교차 상관(집단 효과)의 강도를 정량화한다. 알고리즘은 비가우시안·이상 데이터에 적용 가능하고, 디지털 X‑ray 회절 스펙트럼에 적용해 생물학적 활성을 가진 콘포머를 식별함으로써 Koshland 가설을 실증한다.
상세 분석
이 연구는 데이터 과학에서 흔히 마주치는 비정상적 분포와 교차 상관 문제를 프랙탈 이론과 신호‑대‑잡음 비(SNR) 개념을 결합해 해결하고자 한다. 저자는 먼저 무상관(uncorrelated) 랜덤 변수들의 분포가 가우시안 형태를 따르는 경우와, 강한 교차 상관이 존재할 때 나타나는 비가우시안 형태를 구분하기 위한 지표로 SNR을 정의한다. 전통적인 SNR은 신호의 평균 제곱과 잡음의 평균 제곱 비율로 계산되지만, 여기서는 데이터 집합 자체를 프랙탈 구조, 즉 Cantor dust 형태의 폐쇄 루프에 매핑한다. 이 매핑 과정에서 각 데이터 포인트는 0과 1 사이의 이진 문자열로 변환되고, 그 문자열의 자기유사성(자기복제) 정도가 프랙탈 차원(D)으로 표현된다.
프랙탈 차원을 이용해 구한 “프랙탈 다양성”은 다음과 같이 정의된다.
( D = \frac{\log(N_{occupied})}{\log(1/\epsilon)} )
여기서 ( N_{occupied} )는 스케일 ( \epsilon )에서 차지된 구간 수이며, ( \epsilon )는 데이터 포인트 간 거리의 최소 단위이다. 이 차원값을 기반으로 신호 성분과 잡음 성분을 각각 ( S = \sum_{i} (x_i - \bar{x})^2 \cdot f(D_i) ), ( N = \sum_{i} (x_i - \bar{x})^2 \cdot
댓글 및 학술 토론
Loading comments...
의견 남기기