Title: Can Bioinformatics Be Considered as an Experimental Biological Science?
ArXiv ID: 1607.04836
발행일: 2016-07-19
저자: Olaf Ilzins, Raul Isea, Johan Hoebeke
📝 초록 (Abstract)
바이오정보학은 생물학적 데이터를 다루는 정보과학 분야로, 최근에는 단순히 데이터베이스 관리 이상으로 이해되어야 한다. 이 논문에서는 바이오정보학을 실험 과학의 한 부분으로 보고, 이를 통해 새로운 생물학적 지식을 획득하고 검증하는 방법에 대해 설명한다. 또한, 바이오정보학은 데이터 분석과 모델링을 통해 복잡한 생물학적 상호작용을 이해하고 실험적으로 검증할 수 있는 도구로 사용될 수 있음을 강조한다.
💡 논문 핵심 해설 (Deep Analysis)
1. 바이오정보학의 정의와 역할
바이오정보학은 단순히 데이터베이스 관리 이상으로, 생물학적 정보를 수집하고 분석하여 새로운 지식을 창출하는 과학이다. 이는 전통적인 실험 방법과 결합하여 복잡한 생명현상을 이해하는데 중요한 역할을 한다. 예를 들어, PCR 프라이머 설계와 같은 초기 도전 과제에서부터 시작해, 바이러스의 유전 물질 확산 과정까지 다양한 분야에서 활용되고 있다.
2. 가설 생성과 검증
바이오정보학은 데이터 분석을 통해 새로운 가설을 생성하고 이를 실험적으로 검증하는 과정에 중요한 역할을 한다. 예를 들어, CCMV 바이러스의 캡시드 내에서 유전 물질의 자발적 방출에 대한 가설은 X선 결정학 데이터와 컴퓨터 시뮬레이션을 통해 제시되었다. 이러한 가설은 실험실에서 검증되어야 하며, 이를 통해 새로운 지식을 획득할 수 있다.
3. 데이터 기반 모델링
데이터 기반 모델링은 바이오정보학의 핵심 요소 중 하나로, 복잡한 생명현상을 이해하는 데 중요한 도구이다. 이는 전통적인 물리적 또는 수학적 모델링에서 벗어나, 계산 지능을 활용하여 데이터를 분석하고 새로운 가설을 생성한다. 이러한 모델은 실험실 실험을 통해 검증되고, 이를 반복적으로 개선함으로써 더욱 정교해진다.
4. 바이오정보학의 한계와 미래 전망
바이오정보학의 한계는 주로 컴퓨팅 장비의 물리적 제약에 있다. 그러나 생물학적 실험은 여전히 필수적이며, 이러한 실험 결과는 새로운 지식을 창출하고 실험 설계를 안내하는 데 중요한 역할을 한다. 또한, 분산 연결 네트워크와 같은 새로운 컴퓨팅 패러다임의 발전은 바이오정보학의 미래 전망에 긍정적인 영향을 미칠 것으로 예상된다.
5. 결론
바이오정보학은 정보 기술과 컴퓨터 과학을 활용하여 생명과학에서 새로운 지식을 획득하고 평가하는 실험적 학제간 과학으로 간주될 수 있다. 이는 단순히 데이터베이스 관리 이상의 역할을 하며, 복잡한 생물학적 상호작용을 이해하고 검증하는데 중요한 도구로 활용된다.
6. 미래 연구 방향
미래에는 바이오정보학과 생명과학의 융합을 통해 더욱 정교한 모델링과 가설 생성이 가능할 것으로 예상된다. 또한, 분산 컴퓨팅 기술의 발전은 이러한 과정을 더 효율적으로 수행할 수 있게 할 것이다. 이를 통해 알레르기 원인이나 HIV/AIDS와 같은 복잡한 생명현상을 이해하고 새로운 치료법 개발에 이바지할 것으로 기대된다.
이 논문은 바이오정보학의 중요성을 강조하며, 실험 과학으로서의 위치를 재정립한다. 이를 통해 미래 연구에서 더욱 정교한 모델링과 가설 생성을 가능하게 하며, 생명과학 분야에 새로운 지평을 열 것으로 기대된다.
📄 논문 본문 발췌 (Excerpt)
## 바이오정보학: 실험 과학으로서의 위치
“바이오정보학"이란 무엇을 의미하는가? 콜린스 사전 정의에 따르면, 바이오정보학은 “생화학 또는 제약 정보의 대규모 데이터베이스를 다루는 정보 과학의 한 분야"로 정의된다. 최근 정보 기술의 급속한 발전에도 불구하고, 바이오정보학은 종종 단순히 생물학적 정보를 데이터베이스에 삽입하고 저장하는 과정으로만 설명된다. 이러한 제한적인 정의는 바이오정보학의 개념을 축소시키고, 심지어 역사 속으로 사라지게 할 수도 있다. 오히려 이는 1978년 폴리에인 호게웨그(Paulien Hogeweg)의 제안[1]에서 시작하여 루스콤비 외 연구자[2]에 의해 수정되고, 후아타[3]에 의해 재구성된 정의를 반영해야 한다.
바이오정보학은 건강 과학을 정보 기술과 통합하여 한계나 특정 정의 없이 포괄적으로 생물학을 이해하는 과학이다. 따라서 오믹스 분석을 정보 기술과 구분하는 것은 불가능하다. 이는 관련 저널의 증가 추세를 통해 입증된다.
더 공식적으로, 우리는 바이오정보학이 수치적으로 과도하게 복잡하거나 조직화 또는 분석하기 어려운 상호작용을 개념화하는 것으로 정의할 수 있다. 이러한 상호작용에 대한 정보 기법을 적용함으로써 관련 정보를 추출하고, 이를 통해 생물학적 관계와 전반적인 과학적 지식을 심화시킬 수 있다. 따라서 관찰된 현상을 기반으로 거시분자, 다른 상호작용체 또는 집단 사이에서 수행되는 수치 분석, 수학 변환 및 도출은 생물학적으로 의미 있는 정보를 드러낼 수 있다. 도출된 정보는 실험을 통해 검증될 수 있다. 이처럼 바이오정보학 자체가 과학적 실험인 이유는 가설을 생성하고 이를 실험적으로 검증하거나 반증할 수 있기 때문이다.
가설의 검증을 위해 세 가지 예를 살펴보자.
첫째, 전통적인 도구에서 새로운 지식 획득의 관문으로의 진화를 살펴보자. 바이오정보학의 초기 도전 과제 중 하나는 PCR 프라이머 설계였다. 올리고뉴클레오타이드 행동에 대한 관찰을 코딩한 프로그램이 개발되었다(예: [4]-[6]). 이러한 일반적인 프로그램은 등온 조건에서 증폭될 수 있는 미관찰 시퀀스를 예측했다. 이를 루프 매개 등온 증폭(LAMP) PCR[7]이라 부르며, 이는 빠르고 매우 민감한 기법으로 추출된 DNA 없이 또는 고급 장비인 열 사이클러가 필요하지 않은 장점이 있다. 이러한 예는 사전 바이오정보학 지식을 바탕으로 진단 확인을 돕는다.
둘째, 컴퓨터 시뮬레이션을 통해 유전 물질의 확산 과정에 대한 인과 관계를 제시하는 사례를 살펴보자. 콩잎 황변 모질 바이러스(CCMV)와 같은 바이러스의 캡시드 식물 내에서 유전 물질의 확산 과정은 복잡한 동적 과정으로, X선 결정학 데이터에서 얻은 스냅샷을 통해 연구된다. 원자 이동을 기록하는 데 필요한 엄청난 양의 데이터 처리로 인해 핵자기공명(NMR)을 사용하여 원자의 동역학을 추적하는 것은 거의 불가능하다. 이세아 외 연구자[10]는 CCMV 캡시드 내에서 유전 물질이 에너지 입력 없이 자발적으로 방출된다고 가설화했으며, 이는 감염 메커니즘이 유전 물질에서 자발적으로 발생한다는 것을 시사한다. 이러한 결과는 인간 수용체 특이성에 대한 H5N1 인플루엔자 A 바이러스의 예측[11]과 유사한 실험을 통해 검증되어야 한다. 이 예시는 바이오정보학 예측의 중요성과 실험 과학과의 상호작용을 보여준다.
데이터 기반 모델링과 바이오인포매틱스의 역할
마지막으로, 데이터 기반 모델링에 대해 살펴보겠습니다. 데이터 기반 모델링은 전통적인 물리적 또는 수학적 모델링에서 벗어나, 계산 지능(복잡하고 변화하는 환경에서 지능적인 행동을 가능하게 하거나 촉진하는 적응 메커니즘을 연구하는 인공지능의 하위 분야) 분야에서 도출된 다양한 접근 방식을 통해 점 관측치와 시간 시리즈 데이터를 분석합니다. 이러한 모델은 실험실 실험을 통해 모델의 출력을 검증한 후, 새로운 데이터를 포함하는 반복 사이클을 통해 매개변수를 추론함으로써 정교화될 것입니다.
이러한 다차원 관계와 상호작용을 추론하고 검증하는 방법은 지식 생성에서 다양한 분야에 큰 영향을 미칠 것으로 예상됩니다. 이러한 지식은 다음과 같은 영역에 유용합니다:
포유류 세포의 대사 경로 통합 (예: 간세포 [13])
토포질라 곤디 (Toxoplasma gondii)와 같은 기생충에 대한 새로운 약물 설계 타겟 제안 [14]
급성 골수성 백혈병과 같은 종양 질환의 병리생리학에 대한 통찰력 확보 [15]
바이오인포매틱스는 정보 기술과 컴퓨터 과학을 활용하여 생명과학에서 새로운 지식을 이해하고 획득하며 평가하는 실험적 학제간 과학으로 간주될 수 있습니다.
초기 바이오인포매틱스는 시퀀스 간 잠재적 유사성을 식별하는 등 실험 데이터 관리와 기본적인 작업을 수행하는 도구로 시작되었습니다. 그러나 현재 이용 가능한 방대한 정보량과 컴퓨팅 기술의 발전으로 인해 과학자들은 새로운 생물학적 과정, 예를 들어 바이러스 유전 물질이 게놈에 침투하는 과정을 밝혀낼 수 있는 분석 및 가설 도출이 가능해졌습니다.
현재 바이오인포매틱스의 한계는 생명과학적 문제에 대한 인간의 지식 부족보다는 컴퓨팅 장비 자체의 물리적 제약보다 더 큰 관련이 있습니다. 그러나 생물학적 in vitro 및 in vivo 실험은 여전히 필수적인데, 이는 바이오인포매틱스가 이러한 실험을 대체할 수 없기 때문입니다. 하지만 이러한 실험 결과는 생명과학 과정에 대한 이해를 향상시키고, 새로운 실험 설계를 위한 지침이 될 수 있습니다.
…(본문이 길어 생략되었습니다. 전체 내용은 원문 PDF를 참고하세요.)…