转录组分析3——认识SAM文件和BAM文件

1.SAM文件

SAM全称:sequence alignment/map format。
BAM是SAM的二进制文件(B源自binary)。
SAM/BAM文件构成:
标头注释部分(header section)
比对结果部分(alignment section)

2.SAM/BAM格式

image.png

比对结果部分(alignment section)
• 1.每一行表示一个read的比对信息。
• 2.每行包括11个必须字段和1个可选字段,字段之间用制表符分割。

image.png

image.png

计算FLAG值的网站:
https://www.samformat.info/sam-format-flag
FLAG详解 http://broadinstitute.github.io/picard/explain-flags.html

image.png

image.png

还有一个是CIGAR的解释(第6列)

image.png

👆分割线

下面是SAMtools的介绍:是SAM文件和BAM文件专用的工具集

http://www.htslib.org/doc/samtools.html
//www.greatytc.com/p/240bffd7cf00

image.png

子命令

samtools flagstat命令:对BAM文件结果进行统计

image.png

统计结果

用flagstat检查比对失败reads

总共有53566比对成功
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。