Amplicon sequencing

Introduction

(기본개념) Amplicon sequencing은 PCR을 이용해 증폭한 DNA인 amplicon의 서열을 결정하는 실험이다. 이 방법은 다양한 미생물이 섞여 있는 미생물 균총에 어떤 미생물이 존재하는지, 그리고 그 상대적인 양은 얼마인지 측정하기 위해 주로 이용된다. 세균은 그 종류에 따라 서로 다른 16S rRNA 유전자 서열을 지니고 있으며, 동시에 16S rRNA의 일부분은 매우 잘 보존된다는 특성을 활용한 방법이다. 매우 잘 보존되는 두 부분에 결합하는 primer를 이용해 PCR 반응을 진행하면, 그 사이에 있는 변이가 높은 서열을 읽을 수 있고, 해당 서열로부터 미생물의 종류를 특정할 수 있다. 더 나아가, 각각의 서열이 몇 번 관찰되는지 분석함으로써 분석한 샘플 안에 존재하는 미생물의 상대적인 양을 분석할 수 있다.

(가변영역) Illumina MiSeq 과 같은 NGS 방법을 통해 읽을 수 있는 서열의 길이가 500개 미만으로 제한된다. 따라서 bacterial 16S rRNA gene 서열 전체가 아닌 16S rRNA 서열의 variable region을 PCR을 이용해 증폭한다. Bacterial 16S rRNA는 잘 보존된 지역과 속 혹은 종 별로 차이를 보이는 9개의 가변 지역 (variable region)을 가지고 있다. PCR을 이용해 variable region의 서열을 증폭함으로써, 어떤 환경 혹은 샘플 안에 존재하는 미생물의 조성을 분석할 수 있다.

가변영역의 변화는 미생물의 종류에 따라 차이를 보인다. 따라서 증폭할 가변 영역 선택에 따라 분리할 수 있는 미생물의 종류가 달라진다. 자세한 사항은 다음 논문을 참고한다.

참고 논문: Johnson, J. S., et al. (2019). “Evaluation of 16S rRNA gene sequencing for species and strain-level microbiome analysis.” Nat Commun 10(1): 5029.

Amplicon primers for bacteria

Klindworth et al.는 in silico amplicon sequencing 을 통해 V3-V4 region을 대상으로한 아래의 primer 서열이 bacteria 분류를 위해 가장 좋은 서열임을 발견하였다 (A. Klindworth, Nucleic Acids Res., 41 (2012), p. e1). Primer의 서열은 아래와 같다. 여러 연구에서 이 영역을 분석 대상으로 삼고 있는 것을 알 수 있다. 하지만, 각 연구의 목적에 따라 다른 가변 부위를 선택하는 경우가 많이 있으므로, 데이터 분석 시 어떤 영역이 분석에 이용되었는지 확인할 필요가 있다.

RegionDirectionPrimer sequence
v3-v4ForwardCCTACGGGNGGCWGCAG
v3-v4ReverseGACTACHVGGGTATCTAATCC

Illumina (V3-V4)

Klindworth가 제시한 서열은 Illumina에서도 16S rRNA sequencing을 위해 추천하는 primer 조합이다. Illumina에서는 Illumina sequencing을 위한 overhang adapter를 포함한 primer를 추천하고 있으며, 필요에 따라서는 임의의 primer 서열을 이용할 수도 있다.

https://support.illumina.com/documents/documentation/chemistry_documentation/16s/16s-metagenomic-library-prep-guide-15044223-b.pdf

Primer sequence

  • Forward: CCTACGGGNGGCWGCAG
  • Reverse: GACTACHVGGGTATCTAATCC

Primer sequence with overhang adapter

  • Forward: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCTACGGGNGGCWGCAG
  • Reverse: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGACTACHVGGGTATCTAATCC

Overhang adapter

  • Forward: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG‐[locus‐specificsequence]
  • Reverse: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG‐[locus‐specificsequence]

Library construction

PCR 과정을 거처 증복한 DNA를 library라 한다. 샘플에서 genomic DNA를 추출하고, PCR 반응을 수행하고, 증폭한 DNA를 추출하는 과정을 거친다. 실험 목적에 따라 DNA를 준비하는 과정에서 많은 차이가 발생한다. 다음은 한국식품연구원에서 사용하는 프로토콜의 일부이다.

  • QIAamp DNA stool minikit
  • Bead bitting and Lysis: Zirconia beads (BioSpec), ASL lysis buffer (Qiagen), 95 degrees 15 mins, bead beating 30Hz 1 min (Qiagen TissueLyser II)
  • Extraction: QIAcub system (Qiagen)

실험 방법에 대해서는 다음 논문을 참고한다.

Lim, M. Y., et al. (2021). “Gut Microbiome Structure and Association with Host Factors in a Korean Population.” Msystems 6(4).

Amplicon sequencing

Data analysis

Sequencing machine에서 얻은 결과를 각 sample에 대한 barcode를 이용하여 분리(demultiplexing)하면, 각 샘플에 대해 forward와 reverse의 두 개의 FASTQ format 파일을 얻을 수 있다 (paired-end sequencing).

Generate microbial feature table

Generate microbial feature table

Taxonomy annotation

Taxonomy annotation for amplicon sequencing

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top