对BUSCO的结果进行总结

平时我们对每个基因组做了BUSCO,但是官方提供的画图代码很难用,所以决定自己提取出BUSCO的结果并进行画图,这一串代码就可以批量从BUSCO的结果中提取出我们想要的结果:

# 提取数字并写入txt文件
echo "voucher C S D F M" > busco_summary_table.txt;

for i in $(cat list.txt); do
  filename="${i}/busco/short_summary.specific.agaricales_odb10.busco.txt"
  if [ -f "$filename" ]; then
      # 提取数据 
      data=$(grep -oP 'C:([\d.]+)%\[S:([\d.]+%),D:([\d.]+)%\],F:([\d.]+)%,M:([\d.]+)%,n:\d+' "$filename" | awk -F'[:,%[]' '{print $2, $5, $8, $11, $14}')
      # 将数据写入表格
      echo "${i} $data" >> busco_summary_table; else
      echo "${i} There is no BUSCO results in ${i}!" >> busco_summary_table;
  fi
done
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容