0
点赞
收藏
分享

微信扫一扫

使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序?

目录

  • ​​需求​​
  • ​​实现​​

需求

已知某基因组序列,染色体或scaffold ID顺序不定,想要对其按数字排序。
使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序?_html
原顺序:
使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序?_html_02

想要的排序结果:
使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序?_javascript_03

实现

使用bioawk,没有的话conda直接安装。

bioawk -c fastx '{print}' old.genome.fa |  \
  sort -k1,1V | awk '{print ">"$1;print $2}' >new.genome.fa


​​https://www.biostars.org/p/494201/​​



作者:Bioinfarmer,若要及时了解动态信息,请关注同名微信公众号:Bioinfarmer。

举报

相关推荐

0 条评论