생물의학 데이터 과학 현황과 도전 과제
본 논문은 데이터 과학의 정의와 전 세계적 확산 흐름을 검토한 뒤, 특히 생물의학 분야에 적용되는 특성을 조명한다. 구글 트렌드 분석을 통해 “Data Science”, “Big Data”, “Cloud Computing” 용어의 성장 패턴을 제시하고, 의료·생물학 데이터에 필요한 기술·역량과 현재 주요 학술지 현황을 정리한다.
저자: Yovaninna Alarcon-Soto, Jenifer Espas, in-Dominguez
본 논문은 데이터 과학(Data Science, DS)의 정의와 역사적 배경을 서술하면서, 1960년대 John Tukey가 “데이터 분석”이라는 개념을 제시한 이후 현재까지 5·10년 주기로 급격히 성장해 온 과정을 조명한다. 저자는 DS를 “복잡한 디지털 데이터를 분석·해석하여 비즈니스·연구 의사결정을 지원하는 학문”으로 정의하고, 이를 구현하기 위한 네 가지 핵심 역량—수학·통계, 컴퓨터 과학, 도메인 지식, 그리고 소프트 스킬(커뮤니케이션, 협업, 리더십, 학문적 지속성)—을 제시한다. 특히, Conaway(2010)의 Venn 다이어그램을 기반으로 이 네 축이 겹치는 영역을 시각화하고, 데이터 과학자가 단순 기술 전문가를 넘어 통합적 사고와 의사소통 능력을 갖춰야 함을 강조한다.
다음으로 전 세계적인 DS 확산 현황을 정량적으로 분석한다. 저자는 Kane(2014)의 연구를 업데이트하기 위해 Google Trends 데이터를 활용했으며, “Data Science”, “Big Data”, “Cloud Computing”이라는 키워드의 검색 트렌드를 2005~2018년 기간 동안 전 세계 및 주요 국가·지역(미국, 독일, 영국, 스페인, 중국, 일본, 인도, 호주 등)별로 시각화하였다. 결과는 2012년 이후 “Data Science” 검색량이 급격히 상승하고, “Big Data”는 2014년 정점 이후 완만히 감소, “Cloud Computing”은 2011년 피크 후 감소 추세를 보였다. 국가별로는 미국·독일·영국 등 기술 선진국이 높은 관심을 보인 반면, 스페인·이탈리아 등 남유럽은 비교적 늦은 상승세를 보였으며, 아시아 국가들은 전반적으로 상승하나 서구에 비해 성장률이 낮았다.
학술지 현황을 살펴보면, 2018년까지 데이터 과학 전용 저널은 7곳에 불과했으며, 대부분이 통계·머신러닝·빅데이터 중심으로 생물의학 전용 저널은 거의 존재하지 않는다. Table 1에 제시된 저널들은 오픈 액세스 여부, 스코푸스 색인, 생물·보건 분야 명시 여부 등에서 차이를 보이며, 이는 BDS 분야가 아직 전용 출판 플랫폼을 확보하지 못했음을 시사한다.
본 논문의 핵심 파트는 “Biomedical Data Science (BDS)”에 대한 정의와 도전 과제이다. BDS는 유전체, 전자건강기록(EHR), 의료 영상, 센서 데이터 등 다양한 출처의 이질적인 데이터를 다루며, 데이터 전처리·표준화·프라이버시 보호·고성능 컴퓨팅 인프라 구축 등 복합적인 문제에 직면한다. 저자는 이러한 문제를 해결하기 위해 다학제 협업 팀을 구성하고, 클라우드 기반 분석 파이프라인을 활용할 것을 제안한다. 또한, 데이터 과학자는 도메인 지식뿐 아니라 윤리·법률적 이해가 필요하다고 강조한다.
결론적으로, 데이터 과학은 전통적인 통계·컴퓨터 과학을 넘어 의료·생물학 연구에 필수적인 촉매제로 자리매김하고 있다. 그러나 인재 부족, 전용 학술 플랫폼 부재, 국가·지역별 인프라 격차 등 해결해야 할 과제가 여전히 많으며, 향후 BDS의 지속 가능한 성장과 혁신을 위해서는 교육·연구·산업 생태계 전반에 걸친 협력이 필요함을 역설한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기