다학제 팀 추천의 Zen: 학술 협업을 위한 통합 프레임워크
초록
본 논문은 전문가의 역량, 사회적 관계, 과거 협업 이력을 그래프로 모델링하고, 이를 결합해 개인 맞춤형 팀을 추천하는 일반적인 프레임워크(SWAT)를 제시한다. 학술 연구팀을 사례로 데이터 수집·정제·그래프 구축 과정을 상세히 설명하고, 대규모 지식베이스와 페이스북 연동 기능을 구현한다.
상세 분석
논문은 팀 구성 문제를 “역량‑사회‑역사” 3차원 그래프 모델로 추상화한다. 역량 그래프는 개인(I)과 전문 분야(EA)를 연결하는 이분 그래프로, 각 엣지는 0~1 사이의 실수 라벨 c 로 개인의 해당 분야 숙련도를 표현한다. 사회 그래프는 다중 방향 그래프로, 엣지는 (사회 차원 d, 강도 s) 튜플을 갖으며, 동료·친구·멘토 등 다양한 관계를 동시에 모델링한다. 방향성을 허용함으로써 관계 강도의 비대칭성을 반영한다. 역사 그래프는 과거 팀(T) 정보를 담은 무향 이분 하이퍼그래프로, 팀은 최소 두 명 이상의 개인이 여러 전문 분야를 동시에 수행한 경우로 정의된다. 이러한 구조는 팀의 기술적 적합성(전문 분야 커버)과 사회적 응집성(강한 사회적 연결) 모두를 정량화할 수 있게 한다.
프레임워크 구현 단계에서는 (1) 개인·전문 분야·관계 차원 정의, (2) 웹·학술 DB·소셜 네트워크 크롤링, (3) 엔터티 추출·그래프 마이닝·전문성 자동 분류 등 여러 서브시스템을 조합한다. 특히 DBLP, Microsoft Academic, Google Scholar 등에서 논문 메타데이터를 수집하고, 위키피디아 카테고리를 활용해 전문 분야 간 상하위·동의어 관계를 구축한다. 주제 추출은 최신 위키피디아 기반 의미소거 기법을 적용해 논문 제목·초록에서 키워드를 자동 도출한다.
데이터 정제 과정에서는 크롤링 오류, 스키마 불일치, 시간에 따른 프로필 변동 등을 교정하기 위해 crowdsourcing 도구를 연동한다. 이렇게 정제된 데이터는 99만 명 이상의 개인, 55만 개 이상의 개념, 294만 개 이상의 팀을 포함하는 대규모 지식베이스를 형성한다. 평균 연결 수·팀 규모 등 통계는 최근 팀 규모 확대 추세와 일치한다.
시스템은 독립형 웹 애플리케이션과 페이스북 앱 두 형태로 제공되며, 사용자는 원하는 과제의 전문 분야와 사회적 선호(예: 친밀도, 지리적 근접성)를 입력해 맞춤형 팀 리스트를 얻는다. 추천 결과는 역량 적합도, 사회적 응집도, 과거 협업 성공도 등을 종합한 점수로 정렬되며, 사용자는 각 지표를 가중치 조정해 개인화할 수 있다. 전체 설계는 모듈화돼 있어 다른 도메인(기업, 의료 등)에도 손쉽게 적용 가능하다.
댓글 및 학술 토론
Loading comments...
의견 남기기