데이터 과학 서커스와 대텐의 선택

이 논문은 데이비드 도노호의 “50 Years of Data Science”를 비판적·역사적으로 재조명하며, 데이터 과학을 ‘세 개의 링을 가진 서커스’와 ‘하나의 큰 텐트’ 두 가지 메타포로 나눈다. 저자는 학문적 정체성, 교육 커리큘럼, 산업·학계 협력 구조를 분석하고, 데이터 과학이 독립된 학문 영역으로 자리매김하기 위해 필요한 조건들을 제시한다.

데이터 과학 서커스와 대텐의 선택

초록

이 논문은 데이비드 도노호의 “50 Years of Data Science”를 비판적·역사적으로 재조명하며, 데이터 과학을 ‘세 개의 링을 가진 서커스’와 ‘하나의 큰 텐트’ 두 가지 메타포로 나눈다. 저자는 학문적 정체성, 교육 커리큘럼, 산업·학계 협력 구조를 분석하고, 데이터 과학이 독립된 학문 영역으로 자리매김하기 위해 필요한 조건들을 제시한다.

상세 요약

본 논문은 데이터 과학을 세 가지 전통적 학문 영역—통계학, 컴퓨터 과학, 그리고 도메인 지식—의 교차점으로 보는 ‘세 링 서커스’ 메타포와, 이들 영역을 포괄하고 통합하는 ‘대텐’ 메타포를 대비시킨다. 서커스는 각 링이 독립적으로 존재하면서도 관객을 끌어들이는 쇼를 연출한다는 점에서, 현재 데이터 과학 교육과 연구가 통계, 알고리즘, 도메인 별로 파편화된 현상을 설명한다. 저자는 특히 대학 커리큘럼이 여전히 전통 학과 중심으로 설계돼 있어, 학생들이 ‘서커스’ 안에서 각각의 링을 선택하거나 순회하게 만든다고 지적한다. 반면 ‘대텐’은 하나의 넓은 공간 안에 다양한 공연을 동시에 진행할 수 있는 구조로, 데이터 과학을 하나의 통합된 학문 체계로 재구성하려는 시도를 의미한다. 이를 위해 저자는 세 가지 핵심 요소를 제시한다. 첫째, 학문적 정체성의 명확화이다. 통계학과 컴퓨터 과학이 각각의 방법론적 전통을 유지하면서도, 데이터 과학 고유의 질문—예를 들어 ‘데이터에서 의미를 추출하는 과정’—을 중심으로 새로운 이론적 틀을 구축해야 한다. 둘째, 교육 과정의 통합이다. 현재 많은 대학이 ‘통계학 전공’과 ‘컴퓨터 과학 전공’ 사이에 교차 과목을 두고 있지만, 이는 여전히 두 전공의 경계를 강화한다. 저자는 ‘데이터 과학 전공’이라는 독립 학과를 설립하고, 통계, 알고리즘, 도메인 지식을 동등하게 배치한 커리큘럼을 제안한다. 셋째, 산업·학계 간 협력 메커니즘이다. 서커스 메타포가 암시하듯, 현재 기업과 연구소는 특정 링(예: 머신러닝)만을 활용해 프로젝트를 진행한다. 대텐을 구현하려면, 기업이 데이터 파이프라인 전반에 걸친 협업을 요구하고, 학계는 실무 문제를 연구 주제로 삼아 장기적인 파트너십을 구축해야 한다. 논문은 또한 데이터 과학이 ‘빅 데이터’와 ‘AI’라는 트렌드에 휘말려 본질적 질문을 흐리게 하는 위험성을 경고한다. 데이터 과학이 단순히 도구와 기술의 집합이 아니라, ‘데이터를 통한 인과 추론’과 ‘윤리적 판단’을 포함하는 학문으로 성장하려면, 위 세 가지 조건이 동시에 충족되어야 한다는 것이 저자의 핵심 주장이다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...