前言 王向峰老师2020年发表在《Genomics Proteomics Bioinformatics》(IF=6.597)上的文章。对于做数据分析的人来说,如何挖掘公共数据...
前言 王向峰老师2020年发表在《Genomics Proteomics Bioinformatics》(IF=6.597)上的文章。对于做数据分析的人来说,如何挖掘公共数据...
最近开始写大论文,需要查阅很多综述,并且导入到endnote里,随手记录下来,也许会帮助到大家。 Endnote的下载安装,推荐这篇:https://mp.weixin.qq...
表型数据的描述性统计,是对表型数据进行的基础分析,包括最大值、最小是、均值、方差、极差等。通过SPSS、Excel或者R都可以完成,R与其他两种方法对比,只需要简单的命令就可...
在上篇帖子中介绍了如何用qtl这个R包进行单QTL定位,但有很多复杂性状都是由多位点共同控制的。有些位点之间可能存在连锁,即加性效应或上位性效应,本篇文章将介绍如何通过二维双...
在进行单QTL和双QTL基因组扫描后,最好将确定的位点合并成一个联合模型,然后进一步探讨QTL的可能性。 在此工作中,我们使用由makeqtl()创建的QTL对象,利用fit...
ggcorr()是一个基于ggplot2,进行相关性矩阵可视化的R包。 官方说明书:https://briatte.github.io/ggcorr/[https://bri...
R真的很奇怪,在Windows下使用各种友好,一放到Linux里就各种花式报错,要是Linux还没有root权限,那实在是一项非常有挑战性的工作了,传统方法对于环境的要求很高...
保证关联分析成功的关键• 精确可靠的表型• 表型重复方差最小化,尽量减少非系统测量误差;• 表型的遗传力最大化。• 假阳性最低化:尽可能减少位点间的非连锁相关的影响• GWA...
TASSEL是最早出现的用于动植物关联分析的软件,还可以对进化模式以及连锁不平衡进行评估,功能非常强大,要说缺点,可能就是真的有点慢。 表型数据处理在下面这篇帖子中有介绍,这...
Title: Genetic and phenotypic analyses reveal major quantitative loci associated to fru...
写在前面的话,不要用NCBI,不要用NCBI,不要用NCBI!!!重要的事情说三次!!!真的太垃圾了,气的我要爆炸,来回检查没错误就是下不了,换了EBI下载速度飞起,NCBI...
有时一些有特殊拓展名的文件在winscp中隐藏显示,例如.aspera,在查看文件的时候就会很不方便,这时需要显示隐藏文件。设置方法如下: 即可显示隐藏文件
EMMAX是关联分析速度提升的一个代表性算法, 已广泛应用于棉花、大豆和水稻等的复杂性状关联分析。EMMAX认为,每一个SNP对复杂性状的解释率都很低,每个组件的方差在运算中...
常用的显著性阈值确定方法是:Bonferroni correction = 显著性水平(0.01/0.05)/检验次数(number of detected markers)...
在R中进行整理,pmap格式在下面帖子中有详细介绍。第一列为SNP的ID,第二列为chr,第三列为SNP的位置,第四列开始为每个性状的SNP的P值。9.3 GWAS:关联分析...
在前两篇帖子中介绍了数据的导入清洗,以及一步法构建网络,这篇文章将介绍网络构建的第二种方法,分步法。WGCNA(1):R包安装及数据导入清洗 - 简书 (jianshu.co...
前面的文章中完成了数据导入和网络构建,下面是将基因模块与性状进行关联,从而识别与表型相关的重要基因。WGCNA(1):R包安装及数据导入清洗 - 简书 (jianshu.co...
在前面的帖子中介绍了数据的导入和清洗,网络构建的两种方法,模块与性状的关联,这篇文章将介绍如果进行模块可视化。WGCNA(1):R包安装及数据导入清洗 - 简书 (jians...