欢迎关注”生信修炼手册”!
DGVa是一个来自EBI的染色体结构变异数据库,通过文献整理和科研人员提交两种方式,存储了多个物种的染色体结构变异信息,网址如下
https://www.ebi.ac.uk/dgva
如下图所示
该数据库与NCBI的dbvar数据库是合作关系,二者会及时的进行数据交换。该数据库的信息可以通过EBI的基因组浏览器或者biomart系统进行查看,同时也提供了FTP下载功能。另外,该数据库中的部分信息也导入到了DGV数据库中。
和dbvar数据库一致,该数据库中的信息也分为了以下3个level
- study,用std表示, 代表一个研究项目,该项目包含了一组结构变异分析结果,每个study有一个唯一的编号,如果来自NCBI,则以nstd开头,如果来自EBI,则以estd开头
- variant regions, 用sv表示,代表存在结构变异的基因组区域,同样有一个唯一的编号,如果来自NCBI,则以nsv开头,如果来自EBI,则以esv开头
- variant calls, 用ssv表示,代表一个具体的结构变异事件,包含了缺失,重复,CNV等多种类型,同样有一个唯一的编号,如果来自NCBI,则以nssv开头,如果来自EBI,则以essv开头
图示如下
通过Biomart可以灵活的查看和下载DGVa的数据,示意如下
官网也提供了以study为单位的下载功能,示意如下
DGva和dbvar的数据是同步的,只不过下载的文件格式不同,DGVa提供的是GCF格式,而dbvar则提供了CSV,TSV,VCF等多种格式。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!