Loading [MathJax]/jax/output/HTML-CSS/config.js

Protein Structure Modeling with ColabFold – AlphaFold2

Introduction

ColabFold는 Google Colab 환경에서 AlphaFold2를 수행할 수 있는 기능을 제공한다. Google 계정이 있으면 웹 브라우져를 통해 접근하여 단백질 구조 모델링을 수행할 수 있다. 여기서는 ColabFold를 이용해 단백질 서열을 이용해 구조를 예측하는 실습을 실행하고, 생성된 파일을 분석합니다.

ColabFold

1. 접속

ColabFold는 아래 link를 통해 접속합니다.

아래와 같은 JupyterNotebook 화면을 확인할 수 있습니다.

2. 서열 입력

query_sequence 옆 칸에 구조를 예측할 단백질의 서열을 입력합니다.

3. 구조 모델링

  • “런타임(Runtime)” > “모두 실행(Run All )”을 실행합니다.
  • 구조 모델링이 시작되고, 단백질 구조 예측이 진행됩니다.
  • 최종 생성 파일 (.zip) 파일이 생성되면 결과를 받을 수 있습니다.

4. 결과

4.1. Multiple Sequence Alignment

  • 진화하적으로 연관된 서열

4.2 Model 생성

  • 예측 구조 생성 (5개 구조 생성)

4.3. 구조 모델 평가

  • pLDDT (predicted Local Distance Difference Test): residue별 위치 정확도 (예측치)
    • > 90: 높은 신뢰도
    • 70-90: 신뢰할 만한 구조 예측
    • 50-70: 낮은 신뢰도 구간
    • <50: 명확한 구조가 존재하지 않는 구간
  • pTM (predicted TM score): 전체 구조(fold)의 신뢰도
    • > 0.7: 전체 구조(fold)가 일치할 가능성이 높음
    • <0.5: 전체 구조가 정확하지 않을 가능성이 있음
  • pIDDT (predicted Inter-residue Distance Difference Test): complex 구조의 chain 간 구조 정확도 (AlphaFold-Multimer)

Leave a Comment

Your email address will not be published. Required fields are marked *