Introduction
ColabFold는 Google Colab 환경에서 AlphaFold2를 수행할 수 있는 기능을 제공한다. Google 계정이 있으면 웹 브라우져를 통해 접근하여 단백질 구조 모델링을 수행할 수 있다. 여기서는 ColabFold를 이용해 단백질 서열을 이용해 구조를 예측하는 실습을 실행하고, 생성된 파일을 분석합니다.
ColabFold
1. 접속
ColabFold는 아래 link를 통해 접속합니다.
- Google Colab – AlphaFold2 by
아래와 같은 JupyterNotebook 화면을 확인할 수 있습니다.

2. 서열 입력
query_sequence
옆 칸에 구조를 예측할 단백질의 서열을 입력합니다.
3. 구조 모델링
- “런타임(Runtime)” > “모두 실행(Run All )”을 실행합니다.
- 구조 모델링이 시작되고, 단백질 구조 예측이 진행됩니다.
- 최종 생성 파일 (.zip) 파일이 생성되면 결과를 받을 수 있습니다.
4. 결과
4.1. Multiple Sequence Alignment
- 진화하적으로 연관된 서열

4.2 Model 생성
- 예측 구조 생성 (5개 구조 생성)

4.3. 구조 모델 평가
- pLDDT (predicted Local Distance Difference Test): residue별 위치 정확도 (예측치)
- > 90: 높은 신뢰도
- 70-90: 신뢰할 만한 구조 예측
- 50-70: 낮은 신뢰도 구간
- <50: 명확한 구조가 존재하지 않는 구간
- pTM (predicted TM score): 전체 구조(fold)의 신뢰도
- > 0.7: 전체 구조(fold)가 일치할 가능성이 높음
- <0.5: 전체 구조가 정확하지 않을 가능성이 있음
- pIDDT (predicted Inter-residue Distance Difference Test): complex 구조의 chain 간 구조 정확도 (AlphaFold-Multimer)