Heatmap 시각화(Visualization)를 위한 다양한 툴

Tools


위에 나와있는 여러 종류의 Heapmap 시각화 툴 중, 가장 사용하기 쉽고 정확하며 gencode dataset의 사전처리(pre-processing) 과정이 거의 필요하지 않은 Deeptools에 대해서 다뤄보기로 한다.


Deeptools

INPUT Data: BigWig files of ChIP-seq marks, and feature dataset in BED format


앞서 설명한 바와 같이 Deeptools는 사용하기 쉽고 정확하며 gencode dataset의 사전처리 과정이 거의 필요하지 않다. 사실 Deeptools는 다양한 목적으로 사용될 수 있지만, 여기서는 Heatmap 제작에 관해서만 이야기해보기로 한다. 


Deeptools의 Heatmap 제작 과정은 크게 아래의 2단계로 이루어져있다:

  1.  Matrix file 생성
  2.  Heatmap 제작


그리고 1번의 Matrix file 생성시 사용하는 "computeMatrix" 함수에서 다음의 2가지 옵션을 선택할 수 있다: 

1. A reference-point centered option - dataset의 끝점(시작, 마지막) 혹은 가운데점을 기반으로 Heatmap를 제작하고자 할 때

$ computeMatrix reference-point \ --referencePoint TSS \ # alternatives: TES, center -b 3000 -a 3000 \ # define the region you are interested in -R genes.bed \ -S log2ratio_H3K4Me3_chr19.bw \ --skipZeros \ -o matrix1_H3K4me3_l2r_TSS.gz \ # to be used with plotHeatmap and plotProfile

2. A scale-regions option - 하나 이상의 변수를 가진 dataset에 대한 Heatmap를 제작하고자 할 때

$ computeMatrix scale-regions \ -R genes_chr19_firstHalf.bed genes_chr19_secondHalf.bed \ # separate multiple files with spaces -S log2ratio_*.bw \ or use the wild card approach -b 3000 -a 3000 \ --regionBodyLength 5000 \ --skipZeros -o matrix2_multipleBW_l2r_twoGroups_scaled.gz \ --outFileNameMatrix matrix2_multipleBW_l2r_twoGroups_scaled.tab \ --outFileSortedRegions regions2_multipleBW_l2r_twoGroups_genes.bed


위 예시 코드에 나와있는 command에 대한 자세한 설명은 아래 링크에서 참조하면 된다.

(참조: https://deeptools.readthedocs.io/en/develop/content/tools/computeMatrix.html)


Matrix file이 다 만들어지고나면 아래 명령문으로 Heatmap을 제작할 수 있다.

$ plotHeatmap -m matrix_two_groups.gz \ -out ExampleHeatmap2.png \ --colorMap RdBu \


위 예시 코드에 나와있는 command에 대한 자세한 설명은 아래 링크에서 참조하면 된다.

(참조: https://deeptools.readthedocs.io/en/develop/content/tools/plotHeatmap.html)





'Bioinformatics > Chip-seq' 카테고리의 다른 글

Chip-seq Analysis visualize CovPlot  (0) 2019.02.26
Chip-seq 분석이란?  (0) 2018.10.11

+ Recent posts