bigWig format


파일 유형 하나인 bigWig 포맷은 밀도있고 연속적인 데이터(dense, continuous data)를 Genome Browser상에 그래프에 나타내고자할 때 유용하다. bigWig 파일은 보통 [wigToBigWig]이라는 프로그램을 사용하여 wig 파일로부터 생성하나, bam 파일로부터 bigWig 파일을 생성할 수도 있다. 


bigWig 파일은 인덱스 처리된 바이너리 형태(indexed binary format)로 되어있다. 이와 같은 포맷의 주요 장점은 바로 파일 전체에서 특정 구간을 나타내는데 필요한 부분만 뽑아서 Genome Browser 서버로 보낼 수 있다는 것이다. 따라서, 대용량 데이터셋(dataset)을 다루는 경우, 일반적인 wig파일보다 bigWig파일이 훨씬 더 빠른 작업 속도를 보여준다.


다음은 샘플의 bam 파일로부터 bigWig 파일을 생성하는 방법에 대한 설명이다:

# 필터 처리된 bam 파일을 index 처리 진행 $ samtools index fwd.bam # run bamCoverage $ bamCoverage -b fwd.bam -o newfwd.bigWig


bigWig format에 대한 개념과 bam 파일로부터 bigWig 파일을 생성하는 방법에 대한 자세한 내용은 아래 링크를 참조하면 된다:

참조1: https://genome.ucsc.edu/goldenpath/help/bigWig.html

참조2: https://deeptools.readthedocs.io/en/develop/content/tools/bamCoverage.html

'Bioinformatics' 카테고리의 다른 글

NCBI blast+ local install OS Linux  (0) 2018.12.13
bedtools coverage  (0) 2018.12.04
Miso Analysis  (0) 2018.10.29
SAM FILE Format  (0) 2018.10.18
BED FILE FORMAT  (0) 2018.10.11

+ Recent posts