eQTL 分析
转录组+SNP联合分析:Matrix eQTL R包
文献:Matrix eQTL: ultra fast eQTL analysis via large matrix operations(https://doi.org/10.1093/bioinformatics/bts163)
Matrix eQTL网站:http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/runit.html#inst
Matrix eQTL是一款针对大型矩阵可以超快运行进行eQTL分析的软件(http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/)
eQTL(表达数量性状位点)计算transcript-SNP 的关系,即分析SNP与基因的表达是否相关。由于计算数量巨大,很多人都用较小的数据来做。因此该作者开发了Matrix eQTL,用于处理大数据,支持additive linear and ANOVA models with covariates,并且可以将cis- and trans-eQTLs分开计算。
Matrix eQTL相较于其他软件如FastMap — 18.4 min, Merlin — 12.3 min, Plink — 9.0 min, Matrix eQTL — 5.7 min and snpMatrix — 3.3 min要快,它设置一个阈值,只有超过这个阈值的p值才会被计算。
采用的是线型回归模型,g为基因表达情况,s为SNP分型结果。
说明文档http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/runit.html
示例数据:http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/R.html
运行这款软件,需要提前准备5个文件文件,基因型文件SNP.txt, 表达文件GE.txt, 协变量文件Covariates.txt, 基因位置文件geneloc.txt和SNP位置文件snploc.txt。这几个文件格式如下:
file 1:SNP.txt
行代表SNP,列代表个体
file 2: snpsloc.txt
包含3列,第一列SNP id, 第二列染色体, 第三列SNP位置
file 3: GE.txt
行代表基因表达量,列代表个体
file 4: geneloc.txt
协变量文件包含个体的性别和年龄
分析示例可参考:①多组学联合分析-Matrix eQTL://www.greatytc.com/p/6e6d54d7483e
②Matrix eQTL分析://www.greatytc.com/p/70d7852b7981
③用 Matrix eQTL 进行 eQTL 分析:用 Matrix eQTL 进行 eQTL 分析 - 腾讯云开发者社区-腾讯云 (tencent.com)
参考://www.greatytc.com/p/c520c36fe340
//www.greatytc.com/p/6e6d54d7483e