피어슨 상관계수와 살턴 코사인 측정의 관계
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 벡터의 L1‑norm와 L2‑norm 비율에 따라 달라지는 피어슨 상관계수 r과 살턴 코사인 유사도 사이의 수학적 관계를 밝힌다. 이론적 결과를 24명의 정보계량학자에 대한 공동인용 데이터(비대칭 발생 행렬·대칭 공동인용 행렬)로 검증하고, 코사인 값이 일정 임계값 이상일 때 r이 절대 음수가 되지 않도록 하는 알고리즘을 제시한다.
상세 분석
논문은 먼저 두 벡터 x 와 y 에 대해 피어슨 상관계수 r = cov(x,y)/(σ_xσ_y)와 살턴 코사인 cos = (x·y)/(‖x‖_2‖y‖_2) 사이의 차이를 L1‑norm(‖·‖_1)과 L2‑norm(‖·‖_2)의 비율 α = ‖x‖_1/‖x‖_2, β = ‖y‖_1/‖y‖_2 로 표현한다. α와 β는 각각 1 ≤ α,β ≤ √n( n은 차원) 범위에 놓이며, 이 값이 변함에 따라 r과 cos 사이의 관계식은
\
댓글 및 학술 토론
Loading comments...
의견 남기기