选择1: 拿到测序下机数据,开始分析。首先创建目录 我是使用filezilla将公司给的原始数据上传到raw目录中。一共5个样品,其原始数据存在在以下5个目录中,结构如下: ...
选择1: 拿到测序下机数据,开始分析。首先创建目录 我是使用filezilla将公司给的原始数据上传到raw目录中。一共5个样品,其原始数据存在在以下5个目录中,结构如下: ...
fastp是一款较新的数据质控软件,接触这个软件也是由于目前市场的软件各有功能但是功能都不是很全,譬如最近接触到一个RNAseq数据,质量较差,需要去除接头而且含N较多,序列...
0_1 前言 有时间再详细写introduction。先把我分析数据的流程记录下来,后续持续更新。 0_2 用到的软件或脚本 测序数据质控:fastp[https://git...
导读 Fastp能检测和去除adapter,PE序列overlap区碱基矫正,slide window修剪头尾,polyG/X尾修剪,UMI预处理。多功能合一,速度快,结果好...
关于RNAseq Nature重磅综述 |关于RNA-seq,你想知道的都在这[https://app.yinxiang.com/fx/f8c7f63c-a05e-4ebf-...
写在前面参考1[https://cloud.tencent.com/developer/article/1625193]参考2[//www.greatytc.com...
还在羡慕海峡那边的朋友下载SRA 快到飞起?还在难过用wget 下载数据经常下载不完整?用了官方的下载工具还是慢的不行?这里有一个SRA 下载自救尝试指南供你参考。 需要用到...
一、安装软件 1、HISAT2 将reads比对到基因组上 2、StringTie 将比对好的reads进行拼装并预计表达水平 3、SAM tools 课上已经用sudo a...
刘小泽写于18.9.10实战上从数据下载到差异基因的获得、初步作图实战下进行富集分析,使用数据库进行注释在此感谢jimmy的limma包等教程 1 下载芯片数据 使用Fabb...
刘小泽写于18.9.9今天了解一下背景知识,为下面进行芯片数据分析打下基础 应用领域之基因芯片 Bioconductor的起源就是基因芯片分析,因此提供了芯片数据库如GEO、...
这一篇只是fastp的官方manual,后面再放实操。 1. 主要功能 质量检测 排除质量较差的reads 剪掉质量低的碱基片段 reads首尾剪切 校正低质量碱基 poly...
usage: fastp -i -o <out1> [-I -O <out2>] [options...] options: ## I/O options 即输入...
STAR+RSEM+Deseq2视频课程链接已经公开, https://www.bilibili.com/video/BV1KJ411p7WN?p=8[https://www...
一、简单认识一下GEO数据库 入口:在NCBI主页 http://www.ncbi.nlm.nih.gov/ 的搜索入口输入关键字,比如某个基因或某个疾病,选择数据类型为GE...
一、GEO Datasets各种编号的意义 首先需要捋清楚GEO Datasets中的各种编号。 GPL,platform ID。记录测序或芯片的平台,对于芯片平台,其包含基...
对于很多生命科学研究人员来说,经常会面临这样的问题:“不知该从哪个基因入手研究、有感兴趣的基因但不知道如何深入研究、不知道如何整合某一类疾病研究领域的数据进行分析”。这些困扰...
上一篇文章提到Linux系统下如何下载。但是鉴于服务器网络连接受到限制的问题,所以还是先windows下载,然后再上传吧。那么,windows下怎么搞呢?1.下载window...
老大在群里出的题,说感觉这个热图很诡异,然后中间我自己没有用boxplot查看数据的表达量,对于数据不能有正确的认识,导致一开始的deg的logFC都没有达到正负1的,最重要...
论文 Plasma proteome analyses in individuals of European and African ancestry identify ci...