到现在更多了解之后,认为上一篇《生信入门》还是很扎实的。
学什么都是一个先放后收的过程
想做一个收束和延伸,于是就有了这篇文章。
统计基础、数据处理、作图是三大基础
统计基础就找一本医学统计学简单了解就可以了;
数据处理和作图的话还是看我之前推荐的两本R的书
生信学习分三块
序列比对
Linux上使用各种软件对原始测序结果进行分析;
GWAS是很经典的方法,可以了解一下表达富集及差异分析
建议阅读《advanced R》这本书中对数据结构的描述;
这个过程就是积累方法和R包;
学习R包先从经典的包开始,如limma、Deseq2等;
学R包就是找其中几个关键的方法来看;
学方法是学方法输入和输出的类及类的处理、方法有哪些关键参数机器学习
回归和分类是大部分上述方面的基础,想深入了解这部分是要看的,看这部分要学一点基础的数学,比如线代;
简单了解机器学习,推荐阅读《深入浅出python机器学习》;
需要深入学习背后的理论,推荐阅读《普林斯顿概率论》;
其他
推荐生信入门还是从R语言开始,然后再到序列比对,机器学习的第二本书算是解惑用的;
无论是数据处理,还是作图,都可以作为专门的一个领域来研究了,平时要多练习,可以自己多创建随机数来训练;
《R packages》后面有空再读,再学习写R包;
后面有什么再补充