인포메트릭스에서 가짜과학의 위험
초록
본 논문은 CWTS(레인덹)에서 제시한 논문 인용 정규화 방법이 수학적 연산 순서를 무시함으로써 잘못된 평가를 초래한다는 점을 강조한다. 저자는 물리·의학 분야의 구체적 사례를 들어 평균값을 먼저 구한 뒤 나누는 방식이 실제 물리량이나 재무량에 적용될 수 없음을 증명하고, 인포메트릭스가 과학적 엄밀성을 잃고 가짜과학으로 전락할 위험을 경고한다.
상세 분석
이 논문은 Opthof와 Leydesdorff(2010)의 비판을 계기로 van Raan 등(2010)의 “연산 순서는 무관하다”는 주장에 근본적인 논리적 오류가 있음을 지적한다. 저자는 먼저 수학적 연산 순서, 즉 곱셈·나눗셈을 먼저 수행하고 그 결과를 합산해야 한다는 기본 원칙을 강조한다. 이를 뒷받침하기 위해 체중·신장 비율(Quetelet 지수)과 전력 소비량 계산을 예시로 든다. 평균 체중과 평균 신장을 각각 구한 뒤 비율을 계산하면 실제 개별 사람마다의 체중‑신장 비율을 평균한 값보다 약 30 % 낮아지며, 이는 잘못된 건강 판단을 초래한다. 전력 소비에서도 전압·전류를 개별 가구마다 곱한 뒤 평균을 내야 하는데, 평균 전압과 평균 전류를 곱하면 전력량이 크게 왜곡된다. 이러한 물리적·재무적 양에서는 연산 순서를 바꾸면 보존 법칙(에너지·질량 보존 등)을 위배하게 된다.
인포메트릭스에서 인용 횟수와 저널 평균 인용(JCS)을 다룰 때도 동일한 원리가 적용된다. CWTS는 논문별 인용수를 JCS로 나눈 후 평균을 구하는 것이 아니라, 먼저 논문별 인용/JCS 비율을 계산하고 그 평균을 구한다는 점에서 기존 방법과 차이를 만든다. 저자는 CWTS 방식이 “평균 인용/평균 JCS”를 사용함으로써 실제 개별 논문의 상대적 영향력을 과소평가하거나 과대평가한다고 주장한다.
또한, 통계적 상관관계가 높은 두 방법이 결과적으로 비슷해 보일 수 있지만, 이는 방법론적 타당성을 증명하는 것이 아니라 단순히 데이터의 우연적 일치를 보여줄 뿐이다. 과학적 방법론에서는 연산 순서가 논리적·물리적 일관성을 보장해야 하며, 이를 무시하면 결과 해석이 왜곡되고 정책적·관리적 의사결정에 심각한 오류를 초래한다.
결론적으로, 저자는 인포메트릭스가 다른 과학 분야와 동일한 수학적·물리적 원칙을 적용해야 하며, 그렇지 않을 경우 가짜과학으로 전락할 위험이 있음을 경고한다. 이는 연구 평가 시스템이 개인 과학자와 기관의 자원을 배분하는 데 핵심적인 영향을 미치므로, 연산 순서와 정규화 방법에 대한 엄격한 검증이 필요함을 강조한다.
댓글 및 학술 토론
Loading comments...
의견 남기기