특허 인용 네트워크로 보는 신기술 예측 모델
초록
본 논문은 특허 인용 네트워크를 활용해 기술 분야를 군집화하고, 향후 등장할 신기술 군집을 예측하는 방법을 제시한다. 특허가 받은 인용을 산업 분야별로 벡터화한 “citation vector”를 정의하고, 이를 기반으로 시계열 클러스터링을 수행한다. USPTO 하위 카테고리 11(농업·식품·섬유) 데이터를 이용해 1991년까지의 인용 정보를 바탕으로 군집을 형성하면, 1997년에 신설된 클래스 442와 높은 겹침을 보인다. 이와 같이 특허 인용 네트워크 기반 예측 도구는 과학·기술 정책 수립에 활용될 수 있다.
상세 분석
이 연구는 특허 인용 네트워크를 동적인 그래프로 모델링함으로써, 혁신 과정의 흐름을 정량적으로 포착한다. 핵심 개념인 “citation vector”는 각 특허가 다른 특허들로부터 받은 인용을 사전에 정의된 산업 분야(예: 농업, 식품, 섬유 등)별로 집계한 다차원 벡터이며, 이는 특허가 어느 분야에 얼마나 영향을 미치는지를 정량화한다. 이러한 벡터는 시간에 따라 변동하므로, 연도별 스냅샷을 생성해 시계열 클러스터링을 적용한다. 클러스터링 알고리즘은 주로 계층적 군집화(Hierarchical Agglomerative Clustering)를 사용했으며, 거리 측정으로는 코사인 유사도를 채택해 벡터 간 각도 차이를 강조한다. 이 과정에서 기존 기술 분야 내 재조합(recombination) 현상이 감지되고, 새로운 군집이 형성되는 시점을 사전에 포착할 수 있다. 검증 사례로 USPTO 하위 카테고리 11을 선택했는데, 1991년까지의 인용 데이터를 기반으로 도출된 군집이 1997년에 공식적으로 분류된 클래스 442와 70% 이상 겹치는 결과를 보였다. 이는 인용 네트워크가 실제 기술 진화와 높은 일치성을 가진다는 강력한 증거다. 또한, 이 방법은 특허 텍스트 분석이나 전문가 의견에 의존하지 않고, 순수히 네트워크 구조만으로도 신기술을 예측할 수 있다는 점에서 비용 효율성과 객관성을 동시에 제공한다. 다만, 인용 데이터의 지연(lag) 현상, 특허 전략에 따른 인용 조작 가능성, 그리고 산업 분야 분류의 정밀도 부족 등 몇 가지 한계점도 논의된다. 향후 연구에서는 인용 외에도 공동 발명자 네트워크, 기업 간 협업 네트워크 등을 통합해 다중 레이어 네트워크 모델을 구축함으로써 예측 정확도를 높이는 방안을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기