본 내용은 Pui-Yan Kwok and Xhijie Gu의 "Single nucleotide polymorphism libraries: why and how are we building them? Molecular medicine today 5, 538-543." 내용을 요약 정리한 것입니다.



♠ SNP 개발 과정 


1) SNP를 보유하고 있는 DNA 염기서열을 얻는다. 

2) SNP를 포함하는 DNA부위(STS)를 amplify하기 위한 PCR assay를 개발한다. 

3) sequencing 및 DNA chip기술등을 이용하여 SNP를 동정한다. 

4) SNP를 게놈상의 유일한 위치에 mapping한다. 

5) SNP의 allele frequency를 결정한다. 6) SNP에 대한 genotyping assay를 개발한다. 



♠ SNP를 개발하기 위한 여러 가지 방법  


1.이미 mapping된 STS를 이용한다. 이는 physical mapping에 이미 사용되었던 STS primer set으로 STS를 amplify하여 sequencing 하여 SNP를 찾는 방법으로써, 위에 기술된 SNP 개발 과정 중에서 1), 2), 4)과정을 거쳐야 할 필요성이 없게된다. 미국의 Stanford와 프랑스의 Genset에서 이러한 방법으로 SNP를 개발하고 있다.  


2.EST database를 이용한다. 현재, NCBI에서 구축하고 있는 dbEST에는 약 100만개가 넘는 EST가 축적되어있다. 이들 EST는 각각 다른 개체들의 다른 조직들로부터, 한 유전자에 대해 여러 번 동정 된 결과이므로 SNP가 존재한다는 가정에 근거한다. 이 방법은 위의 개발과정 중에서 1), 3)과정은 필요가 없게 된다. 하지만, 이는 방법의 단순성에 비하여 다음과 같은 문 제점을 내포하고 있다. - Sequencing inaccuracy of ESTs - Error rate of reverse transcritptase - Small size of ESTs - Pseudogenes z Exploiting the human genome project 이 방법은 Human Genome Project(HGP)에 의하여 생산된 genomic sequence를 바 탕으로 SNP를 개발하고자 함을 목적으로 한다. 즉, genomic sequencing에 사용된 BAC, P1 클론의 overlapping되는 region으로부터 sequence variation을 찾는 방법 으로, STS를 amplify하기 위한 PCR assay를 구축하고, SNP를 찾는 과정을 필요로 한다. 


3.Anchored resequencing approach 이는 Celera에서 올해 말까지 완성하여 발표하게될 rough-draft human genome sequence를 reference로 이용하는 것이다. SNP는 상대적으로 짧지만 고도의 정확 성을 갖는 genomic- sequence를 이 reference에 비교하여 동정하게 된다. 즉, rough-draft sequence가 유래한 개인집단과는 다른 개인집단들에서 유래한 locallyconstructed genomic-plasmid library로부터 짧지만 정확한 염기서열을 얻고 SNP는 이들 짧은 서열의 sequence-comparison방법으로 찾게다는 것이다. 이는 앞서의 여 러 방법들의 장점을 공유하는 approach로써 원하는 정도의 밀도와 분포를 갖는 SNP library를 개발할 수 있을 것으로 생각된다. 



♠ SNP resources on the web 


http://www.ncbi.nlm.nih.gov/SNP/ 

https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0075619




출처: http://bric.postech.ac.kr/topic/58.htm

'Bioinformatics > SNP Analysis' 카테고리의 다른 글

SNP란?  (0) 2018.10.05

+ Recent posts