2차원 DNA 디스플레이 모델링: 실험 위치 예측을 위한 간단한 이동도 공식과 파라미터 최적화
📝 Abstract
2D display is a fast and economical way of visualizing polymorphism and comparing genomes, which is based on the separation of DNA fragments in two steps, according first to their size and then to their sequence composition. In this paper, we present an exhaustive study of the numerical issues associated with a model aimed at predicting the final absolute locations of DNA fragments in 2D display experiments. We show that simple expressions for the mobility of DNA fragments in both dimensions allow one to reproduce experimental final absolute locations to better than experimental uncertainties. On the other hand, our simulations also point out that the results of 2D display experiments are not sufficient to determine the best set of parameters for the modeling of fragments separation in the second dimension and that additional detailed measurements of the mobility of a few sequences are necessary to achieve this goal. We hope that this work will help in establishing simulations as a powerful tool to optimize experimental conditions without having to perform a large number of preliminary experiments and to estimate whether 2D DNA display is suited to identify a mutation or a genetic difference that is expected to exist between the genomes of closely related organisms.
💡 Analysis
**
1. 연구 배경 및 목적
- 2D‑DNA‑display는 전통적인 전기영동을 두 단계로 확장한 방법으로, 첫 단계는 겔 메쉬에 의한 크기 의존 이동도, 두 번째 단계는 온도·화학 변성 구배에 의한 서열 의존 이동도를 이용한다.
- 기존 연구는 주로 실험적 경험에 의존했으며, 모델링은 제한된 상황에서만 적용되었다.
- 본 논문의 목표는 (i) 기존 복잡한 이동도 공식들을 단순화하고, (ii) 절대 위치 예측 정확도를 검증하며, (iii) 두 번째 차원 파라미터 추정에 필요한 추가 실험을 제시하는 것이다.
2. 방법론 요약
| 단계 | 핵심 방정식 | 구현 방식 |
|---|---|---|
| 1차원(크기 구분) | ( y(t)=\mu_s E t ) (선형) | Van Winkle et al.의 경험식 ( \mu(N) = L_\mu + (S_\mu-L_\mu)\exp |
📄 Content
1
2차원 DNA 디스플레이 모델링
Ana‑Maria FLORESCU (1), Marc JOYEUX (1) 및 Bénédicte LAFAY (2)
(1) Laboratoire de Spectrométrie Physique (CNRS UMR5588), Université Joseph Fourier
Grenoble 1, BP 87, 38402 St Martin d’Hères, France
(2) Laboratoire Ampère (CNRS UMR5005), Université de Lyon, École Centrale de Lyon, 36
avenue Guy de Collongue, 69134 Écully, France
교신 저자:
Marc JOYEUX
Laboratoire de Spectrométrie Physique (CNRS UMR5588)
Université Joseph Fourier Grenoble 1
BP 87
38402 St Martin d’Hères
France
이메일: Marc.Joyeux@ujf-grenoble.fr
전화: (+33) 476 51 47 51
팩스: (+33) 476 63 54 95
초록
2D 디스플레이는 DNA 조각을 두 단계, 먼저 크기에 따라, 그 다음 서열 조성에 따라 분리함으로써 다형성을 빠르고 경제적으로 시각화하고 게놈을 비교할 수 있는 방법이다. 본 논문에서는 2D 디스플레이 실험에서 DNA 조각들의 최종 절대 위치를 예측하기 위한 모델과 연관된 수치적 문제들을 전면적으로 조사한다. 두 차원 모두에서 DNA 조각의 이동성을 기술하는 간단한 식을 사용하면 실험적 불확실도보다 훨씬 작은 오차로 실험적 최종 절대 위치를 재현할 수 있음을 보여준다. 반면 시뮬레이션 결과는 2D 디스플레이 실험만으로는 두 번째 차원에서 조각 분리를 모델링하기 위한 최적 파라미터 집합을 결정하기에 충분하지 않으며, 몇몇 서열의 이동성을 별도로 정밀 측정해야 함을 시사한다. 이 연구가 많은 예비 실험 없이도 실험 조건을 최적화하고, 2D DNA 디스플레이가 근연 종 사이의 유전적 차이나 돌연변이를 식별하는 데 적합한지 판단하는 강력한 도구가 되기를 기대한다.
1‑ 서론
2차원(2D) DNA 디스플레이는 Fisher와 Lerman에 의해 최초로 보고되었다[1‑3]. 이는 DNA 조각을 두 단계에 걸쳐 전기영동으로 분리하는 기법으로, 첫 단계에서는 크기에 따라, 두 번째 단계에서는 서열 조성에 따라 분리한다. 첫 단계는 일반적인 슬랩 전기영동(아가로스 혹은 폴리아크릴아마이드 겔)에서 수행된다. DNA와 겔 사이의 충돌은 DNA 조각의 이동성을 감소시켜 겔이 체질망 역할을 하게 만들며, 따라서 전기영동 이동성은 크기에 의존하게 된다. 일반적으로 작은 분자가 큰 분자보다 빠르게 이동한다[4].
두 번째 차원에서는 동일한 길이를 가진 조각들을 서열 조성에 따라 분리한다. 이를 위해 온도 구배(TGGE: temperature gradient gel electrophoresis) 혹은 화학 변성제(요오드와 포름아미드 혼합물) 농도 구배(DGGE: denaturing gradient gel electrophoresis)를 이용한다[5,6]. 변성된(단일가닥) 영역의 부피가 이중가닥 영역보다 크기 때문에, 개방된 염기쌍이 많아질수록 조각의 이동성은 감소한다. AT‑풍부 영역은 GC‑풍부 영역보다 낮은 온도에서 녹기 때문에, 일반적으로 GC‑풍부 조각이 AT‑풍부 조각보다 더 멀리 이동한다.
최근 2D DNA 디스플레이는 근연 박테리아의 게놈 비교에 적용되었지만[7‑9], 아직도 주로 경험적 방법에 의존하고 있으며 시뮬레이션은 실험 설계와 결과 해석에 제한적으로만 활용되어 왔다[10‑12]. 특히, 2D 디스플레이 실험에서 DNA 조각들의 최종 상대 위치를 만족스러운 정밀도로 예측할 수 있다는 것이 최근에야 확인되었다[12]. 이 모델은 각 조각의 운동 방정식을 단계별로 적분하고, DGGE 단계에서 각 시점마다 개방된 염기쌍 수를 추정하기 위해 오픈소스 프로그램 Meltsim[13]을 이용한다.
본 논문에서는 위 결과를 다음과 같이 확장한다.
- 기존에 사용된 복잡한 이동성 식을 보다 단순화하여도 예측 정확도가 크게 떨어지지 않음을 보인다.
- 절대 위치를 고려한다. 상대 위치만을 사용하면 기준이 되는 두 조각 중 하나가 잘못 모델링될 경우 전체 위치가 크게 오차를 보일 수 있다. 특히 두 번째 차원은 변성이 급격히 일어나므로 상대 좌표 사용이 의심스럽다.
- 두 번째 차원의 변성 구배와 온도 사이의 관계식을 수정하여 절대 위치를 정확히 재현한다.
- 모델의 모든 파라미터를 전역적으로 최적화하여 모델의 한계와 가능성을 종합적으로 평가한다.
2‑ 재료 및 방법
이동성 µ는 일정 전기장 E 하에서 DNA 서열 s가 시간 t에 위치 y에 있을 때
[ \mu = \frac{dy}{dt}\frac{1}{E} \tag{2.1} ]
와 같이 정의된다.
첫 번째 차원(크기 기반 분리)에서는 µ가 서열에만 의존하고 위치와는 무관하므로(2.1)을 적분하면
[ y(t)=y_0+\mu_s,E,t \tag{2.2} ]
가 된다.
반면 두 번째 차원(TGGE·DGGE)에서는 µ가 서열과 위치 모두에 의존하므로 단계별 적분이 필요하다.
[ y_{i+1}=y_i+\mu\bigl(s,y_i\bigr)E,\Delta t \tag{2.3} ]
본 연구에서는 λ‑파지 게놈 DNA를 EcoRI, Eco47I, Eco91I, HindIII, PstI로 제한하여 얻은 40개의 조각을 대상으로 시뮬레이션을 수행하였다(표 1 참조). 조각 길이는 1 929 bp에서 23 130 bp, GC 함량은 36.0 %에서 58.9 % 사이이다.
- 첫 번째 차원: 전기장 E = 2 V · cm⁻¹, 총 전기영동 시간 t = 8 h을 (2.2)에 대입하였다.
- 두 번째 차원: 전기장 E = 7 V · cm⁻¹, 총 시간 44 h를 7 분 간격으로 (2.3)을 적분하였다. 80 h까지 연장하거나 시간 간격을 1 분으로 줄여도 결과는 변하지 않았다.
DGGE 단계에서 각 위치 y에 해당하는 온도 T(또는 등가 온도)를 구하기 위해 MeltSim[13]을 사용하였다. MeltSim은 Poland 알고리즘[18]과 Fixman‑Freire 가속 근사를 기반으로 하며, Blake·Delcourt 열역학 파라미터[20]와 겔 내 염 농도([Na⁺])를 입력값으로 받는다. 여기서 [Na⁺]는 자유 파라미터로 취급하였다.
모델에 포함된 파라미터들을 실험적 절대 위치와 최소화하도록, RMSD를 최소화하는 gradient 방법을 적용하였다.
3‑ 결과 및 토의
3.1‑ 첫 번째 차원(크기 기반) 이동성
Van Winkle·Beheshti·Rill(vWBR) 모델[14,15]은 세 가지 체질망 구역 전반에 걸쳐 DNA 조각 이동성을 잘 재현한다. 그 식은
[ \mu(s)=\mu_L\exp!\Bigl[-\bigl(\frac{N_s}{m}\bigr)^{!1}\Bigr]+\mu_S\exp!\Bigl[-\bigl(\frac{N_s}{m}\bigr)^{!1}\Bigr] \tag{3.1} ]
이며, 여기서 (\mu_L,\mu_S)는 각각 무한히 큰 조각과 매우 작은 조각의 이동성, (N_s)는 조각 길이, (m)은 “작은”과 “큰”을 구분하는 전형적인 크기이다.
vWBR은 (\mu_L,\mu_S,m)를 겔 농도 C(%)에 따라 다음과 같이 제시하였다(단위: cm²·V⁻¹·s⁻¹, bp)
[ \mu_L=2.78\times10^{-4},e^{-0.749C},\quad \mu_S=5.99\times10^{-5},e^{-0.58C},\quad m=9.75\times10^{3},e^{-0.44C} \tag{3.2} ]
하지만 이 식은 특정 실험계에 최적화된 형태이므로, 다른 겔(예: 폴리아크릴아마이드)이나 전기장 조건에 바로 적용하기는 어렵다.
따라서 우리는 (3.1)의 파라미터 (\mu_L,\mu_S,m)를 절대 위치에 맞추어 직접 최적화하였다. 최적값은
[ \mu_L=4.10\times10^{-2},\text{cm}^2!/(V!\cdot!s),\quad \mu_S=4.10\times10^{-3},\text{cm}^2!/(V!\cdot!s),\quad m=6.40\times10^{3},\text{bp} ]
이며, 이는 (3.2)에서 제시된 값과 크게 차이나는 결과이다. 절대 위치 예측의 RMSD는 0.05 cm로, 실험 평균 불확실도 0.19 cm의 거의 4배에 해당한다(표 1).
3.2‑ 두 번째 차원(서열 조성) 이동성
부분적으로 녹은 DNA의 이동성에 대한 모델은 거의 보고된 바가 없으며, 현재는 [5]의 경험식만이 널리 사용된다. 이 식은
[ \mu(s,T)=\mu_0(s),\exp!\bigl[-r_L,p_T(s)\bigr] \tag{3.3} ]
여기서 (\mu_0(s))는 완전 이중가닥일 때의 이동성, (p_T(s))는 온도 T에서 각 염기쌍이 열릴 확률의 합, (r_L)은 겔 특성(농도·공극 크기)과 단일가닥 DNA의 유연성에 의존하는 크기 파라미터이다. 문헌에 보고된 (r_L) 값은 45 ~ 130 bp 사이이다.
DGGE에서는 온도 대신 변성제 농도 (dC)가 위치에 따라 변한다. 기존에는 변성제 농도와 등가 온도 사이를
[ T = 57 + 2.3,dC \tag{3.4} ]
와 같이 선형 관계로 가정했으나, 우리 실험에서는 절대 위치를 재현하지 못하였다. 따라서 보다 일반적인 형태
[ T = T_0 + \alpha,dC \tag{3.5} ]
를 도입하고, (T_0)와 (\alpha)를 자유 파라미터로 두었다. 또한 변성제 농도 구배에 따라 점도
이 글은 AI가 자동 번역 및 요약한 내용입니다.