介绍
安装
1.下载homer文件
网址:http://homer.ucsd.edu/homer/download.html
下载其中名为configureHomer.pl的文件。
2.在~目录下新建文件夹:homer
mkdir homer
3.将刚下载的pl文件移至homer文件夹中:
mv configureHomer.pl homer
4.开始安装Homer软件:
perl /home/wuxiaobin/homer/configureHomer.pl -install (根据自己的confihureHomer.pl所在的路径更改)
5.将可执行的二进制文件的路径添加至环境变量文件中
vi ~/.bashrc
6.在.bashrc文件的最后一行加上一下内容:
export PATH=/home/wuxiaobin/homer/bin:$PATH
7.激活刚刚添加的环境变量文件:
source .bashrc
使用
homer是一款基于测序数据预测或寻找motif的软件,通常运用于chipseq和clipseq,原因在于探究这些结合蛋白是否会特定结合基因组上的特定序列——称之为motif。
所以如果能够预测知道这些motif,将预测的motif回帖到基因组上,那就可以知道这些蛋白潜在的结合位点。
功能介绍:
1、预测基因组的motif以及对现有注释的motif进行富集
2、可以根据预测完的motif,进行基因组的回帖比对,从而预测蛋白质结合调控于哪些基因
原理:
将pc序列分割成寡聚核苷酸,长度可设定,默认为8,10,12,然后homer会统计所有的相同的序列,这里允许错配,默认为2,统计所有相同的寡聚核苷酸,计算每条寡聚核苷酸位置,四个碱基的比例,从而预测出结果。当完成一条motif预测的时候,与该条motif对应的序列会被删掉,然后重复上述,进行motif地迭代查找。默认25条。
随后,将预测的motif回帖到基因组回去,homer很良心,有可以将得到的motif文件直接回帖到基因组上的函数:http://homer.ucsd.edu/homer/motif/genomeWideMotifScan.html
回扫之后会得到bed文件,该文件记录着motif与基因组的对应信息:
BED (tab) format (use-bed):
chr
start
end
motif name
log-odds score (will be floored to an integer)
strand
最后,可以再将这份bed与gtf参考组做交集,就可以得知每个motif具体结合哪些基因了,更进一步说,可以知道哪些蛋白可能结合哪些基因组或者转录组。