sambamba主要有filter,merge,slice和duplicate等七个功能来处理sam/bam文件。
功能详细介绍见:Sambamba documentation (lomereiter.github.io)
其中的duplicate功能真是太好用了,可以用来代替picard去除重复序列,在筛选标准不变的前提下速度能提升30倍以上。且一直都有更新,目前已经更新到sambamba-0.8.2版本。
具体版本见:Releases · biod/sambamba · GitHub
sambamba有两种安装方式:
1.下载源码文件后编译
wget -c https://github.com/biod/sambamba/archive/v0.6.9.tar.gz
tar -zxvf sambamba-0.6.9.tar.gz
cd sambamba
make
这个时候可能会报错
which: no ldmd2 in (***)
python3 ./gen_ldc_version_info.py > utils/ldc_version_info_.d
make: *** [utils/ldc_version_info_.d] 错误 1
这是因为没有安装ldc这个库,那么就先来安装ldc这个库
wget -c https://github.com/ldc-developers/ldc/releases/download/v1.15.0-beta2/ldc2-1.15.0-beta2-linux-x86_64.tar.xz
tar -Jxvf ldc2-1.15.0-beta2-linux-x86_64.tar.xz
cd ldc2-1.15.0-beta2-linux-x86_64/lib
echo "export PATH=`pwd`:$PATH" >>~/.bashrc
source ~/.bashrc
然后再来安装sambamba
make
还有报错:
make: ldc2:命令未找到
make: *** [singleobj] 错误 127
网上搜到解决方案有多种:
1、切换成root账户再执行(我这边不ok)
2、chmod 777 -R 目录/ (解决问题)
上边的方法2试过,并没有解决问题;由于是非root账户,没办法验证方法1,有条件的同学可以试试看,欢迎反馈尝试结果。
!!!!!!未解决
于是居然发现了另一个捷径:
2.直接下载封装文件
不需要编译,下载完成后直接使用:
wget https://github.com/biod/sambamba/releases/download/v0.8.2/sambamba-0.8.2-linux-amd64-static.gz
gunzip sambamba-0.8.2-linux-amd64-static.gz
mv sambamba-0.8.2-linux-amd64-static sambamba
./sambamba --help #检查是否可运行
echo "export PATH=`pwd`:$PATH" >>~/.bashrc
source ~/.bashrc
清爽又好用,真香!!!
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------I`m a line!Thanks!----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------