0
点赞
收藏
分享

微信扫一扫

BGI-College生信入门系列——3、数据库

爪哇驿站 2022-01-31 阅读 17

一、为什么需要生物数据库

LOCUS       NC_045512              29903 bp ss-RNA     linear   VRL 18-JUL-2020
...
     gene            21563..25384
                     /gene="S"
                     /locus_tag="GU280_gp02"
                     /gene_synonym="spike glycoprotein"
                     /db_xref="GeneID:43740568"

一页A4纸大概能记录1.5万个碱基

在这里插入图片描述

北京大学图书馆以800万册的藏书量坐拥国内高校Top1 按照一本书500页A4纸计算,一个人的基因组约等于200本书,北京大学图书馆纸质书的数量近乎于4万人的基因组。

这还仅仅是一个物种的一小部分,成千上万的物种都有基因组数据,有的基因组甚至是人类基因组的数十倍,如重楼百合有150 Gb大小的基因组(表1), 人均每分钟英文字符的阅读量不足1千个[1] 。

如此算来,即便你昼夜不停地读,也要超过285年才能读完一个重楼百合的基因组序列。此外还有大量的注释信息,需要借助大型计算机才能存储下这些庞大的数据资源。

表1. 代表性物种的基因组大小表1. 代表性物种的基因组大小
二、数据库的分类

表2. 常用的生物数据库
在这里插入图片描述
表3. 常用生物数据库ID
在这里插入图片描述

很多编号看起来挺复杂,还不赶紧收藏一下本帖以备不时之需~

三、数据库的使用

Web blast
在这里插入图片描述

举个例子

寻找同源蛋白

既然可以用序列相似性来判定两个蛋白是否为同源蛋白,那判定的阈值是多少呢?

其它数据库——国家基因库CNGBdb

举报

相关推荐

0 条评论