pasa安装记录和ORF提取

官方文档:https://github.com/PASApipeline/PASApipeline/wiki/Pasa_installation_instructions

之前尝试过很多的帮助,但都遇到了各种阻力,比如说没有root权限啊,各种环境变量的配置啊,不懂sqlite数据库啊

经过两个月的痛苦调研,最后依托conda完成了pasa主程序的使用

1.pasa环境

conda create -n pasa pasa

conda activate pasa 

conda install -y samtools=1.9

conda install -y samtools openssl=1.0

conda自带的pasa环境是有点问题的,经过对报错信息的搜索,修改这两步之后samtool就能正常使用了

2.输入数据

p84k.hq.fasta和poplar_84k_genome_v1.0.fa 

转录组和参考基因组 接下来要通过污染数据库来对p84k.hq.fasta纯化

3.配置UniVec数据库

wget ftp://ftp.ncbi.nih.gov/pub/UniVec/UniVec 

formatdb -i UniVec -p F

无法使用formatdb ,搜索发现makeblastdb也能达到一样的效果。正在探索参数

 makeblastdb -in UniVec -dbtype nucl -input_type fasta -parse_seqids -out UniVec

/PASApipeline.v2.4.1/bin/seqclean transcript.fasta -v /path/to/your/UniVec

可以得到p84k.hq.fasta.clean和p84k.hq.fasta.cln 这几个东西要在同一个文件夹下

4.编辑比对配置文件

cd pasa_conf

cp pasa.alignAssembly.Template.txt alignAssembly.config

vi alignAssembly.config


DATABASE=/tmp/mydb.sqlite  #在一个真实的文件夹下写一个虚拟的文件名

validate_alignments_in_db.dbi:--MIN_PERCENT_ALIGNED=80

validate_alignments_in_db.dbi:--MIN_AVG_PER_ID=80

5.运行主程序

$PASAHOME/Launch_PASA_pipeline.pl -c alignAssembly.config -C -R -g poplar_84k_genome_v1.0.fa -t clustered.hq.fasta.clean -T -u clustered.hq.fasta --ALIGNERS blat  --CPU 1

经查,gmap的环境和conda是有冲突的,需要在conda的环境里注释掉gamp

所以我干脆在--ALIGNERS的参数里面只用了blat  

这里需要跑一段时间

输出包括mydb.sqlite.assemblies.fasta和mydb.sqlite.valid_blat_alignments.gff3 以及一大堆东西

6.提ORF

/home/caocao/miniconda3/envs/pasa/opt/pasa-2.4.1/scripts/pasa_asmbls_to_training_set.dbi 

 --pasa_transcripts_fasta mydb.sqlite.assemblies.fasta 

--pasa_transcripts_gff3 mydb.sqlite.valid_blat_alignments.gff3

得到的输出数据为fasta.transdecoder.cds,.pep,.gff3,.bed 和 fasta.transdecoder.genome.bed,gff3

genome.bed是一种注释信息的格式,在其中有那些基因的起始坐标和终止坐标。可以一定程度上得知ORF的位置和长度

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,284评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,115评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,614评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,671评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,699评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,562评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,309评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,223评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,668评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,859评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,981评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,705评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,310评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,904评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,023评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,146评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,933评论 2 355

推荐阅读更多精彩内容