小编给大家分享一下DGV数据库有什么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
DGV数据库收录了健康样本中大于50bp以上的基因组结构变化信息。
数据库的网址如下
http://dgv.tcag.ca/dgv/app/home
从NCBI dbVar和EBI DGVa两个大型的基因组结构变异数据库中,搜索正常样本对应的研究结果,经过严格的质控之后,将相关数据存储到DGV中来,数据构建的pipeline示意如下
目前该数据库收录了来自55个研究项目,两百多万个基因组结构变异信息,涵盖了多项检测技术的结果,如下图所示
通过首页的检索框,可以方便的进行检索,以CFTR
为例,结果在gbrowser基因组浏览器中进行展示,示意如下
给出了给区域对应的结构变异信息,来自dbVar的是以nsv开头的编号,来自DGVa的是以esv开头的编号,该数据库中收录的是dgv开头的编号,另外还有OMIM, DECIPHER, UCSC segmental duplication等注释信息。
该数据库中收录的CNV的长度如下所示
大部分集中在1-10kb左右,该数据库作为一个正常样本CNV的对照数据集,在进行疾病相关的CNV研究时,可以将与该数据库中重叠的CNV去除,研究剩余的疾病患者特异性的CNV。