Tools

Posts on computational tools

PostgreSQL

PostgreSQL is an open source database management software widely used in scientific researches. This post describe basic usage of PostgreSQL. This includes how to install PostgreSQL in Ubuntu (linux) system, create a user and a database, and use Python (psycopg2) interface. 1. Installation Installation in Ubuntu Administrator account PostgreSQL installation create a administrator account, postgres. […]

PostgreSQL Read More »

PyMol Open Source 윈도우 설치

소개 PyMol은 단백질과 같은 분자의 3차원 구조를 시각화하는 도구이다. PyMol은 Schrondinger (https://www.schrodinger.com/products/pymol)에서 유료로 사용할 수 있는 프로그램이나, open source version도 존재하며, 여기서는 Open Source version 설치 방법을 소개한다. 1. Anaconda 설치 Window에서 PyMol을 사용하기 위해서 환경 관리 프로그램인 anaconda를 설치한다. 이미 컴퓨터에 설치가 되어 있다면, 다음 단계로 넘어간다. 다운로드 URL: https://www.anaconda.com/download 2. PyMol 설치하기 2.1.

PyMol Open Source 윈도우 설치 Read More »

Installation of LEfSe

Introduction LEfSe (Linear discriminant analysis Effect Size)는 통계 분석을 통해 특정 class와 관련있는 feature를 찾는 방법이다. Conda를 이용해 간단하게 설치할 수 있어야 하나, library version 차이로 인해 설치가 원활히 되지 않는 경우가 발생한다. 여기서는 Installation (conda) 아래 명령어 실행을 통해 LEfSe를 설치한다. 다만, 아래 설치는 매우 제한적인 시스템에서 테스트한 결과로, 일부 시스템에서는 정상적으로 설치되지 않을

Installation of LEfSe Read More »

Data type (statistics)

Introduction 사실에 대한 기록을 data(데이터)라 한다. 기록하는 값에 따라 데이터의 type(형태)를 구분할 수 있으나, 그 구분은 목적에 따라 달라지게 된다. 통계 혹은 데이터 과학 분석을 위해서는 continuous value 인지 discrete 값인지 분류가 중요하다. Programming language에서는 데이터를 저장하는 형태에 따라 integer, float, string 등의 데이터 타입이 존재한다. 개별 통계 분석 방법은 데이터의 성질과 밀접히 관련되어 있다.

Data type (statistics) Read More »

ChEMBL database

Introduction ChEMBL은 생리활성분자(bioactive molecules) 데이터베이스로, 화합물(chemical), 생리활성(bioactivity), 유전정보(genomic data)를 종합한 데이터베이스이다. 2023년 8월 기준, 240만개의 화합물, 160만개의 실험 정보, 1만5천개의 타겟 정보가 저장되어 있다. 웹 인터페이스 이용 1. 접근 데이터베이스는 URL을 통해 웹으로 접근할 수 있다. https://www.ebi.ac.uk/chembl/ 2. Target (단백질)에 결합하는 화합물 검색 ChEMBL에서 특정 target (단백질)에 대한 정보를 검색할 수 있다. 2.1. 키워드를 이용함

ChEMBL database Read More »

Kaggle 시작하기 (Kaggle API 활용)

Kaggle은 데이터에 기반한 예측 모델을 만드는 경쟁을 할 수 있는 공간이다. Kaggle에는 다양한 데이터셋이 존재하고, 이를 이용하여 예측 모델을 구성하고, 그 성능을 다른 사람들이 만든 예측 모델의 성능과 비교할 수 있다. 1. Kaggle API를 이용해 시작하기 (Linux) Kaggle competition에 참여하기 위해서는 데이터를 받아서 예측 모델을 만들고, 예측 결과를 Kaggle에 업로드하면 된다. 이 과정을 web을 통해

Kaggle 시작하기 (Kaggle API 활용) Read More »

Docker – 설치

이 문서는 docker 공식 싸이트를 참고해 작성하였다 (https://docs.docker.com/engine/install/ubuntu/). (optional) 이전 버전 docker 지우기 오래된 docker engine이 있는 경우, 아래 명령을 통해 삭제한다. 1. Installation 1.1. Set-up repository Docker engine은 docker hub (repository)을 통해 다른 개발자가 만든 docker image를 활용할 수 있다. 이를 위해 docker engine 설치에 앞서, repository 접근 설정이 필요하다. Install prerequisite packages for

Docker – 설치 Read More »

Scroll to Top