他山之石,可以攻玉:
前面有提到我的基础,所以入门生信对我而言,和诸位刚学生信时是一样的,我是谁?我在哪?我在干什么?接下来我就讲讲我的生信学习历程,也可以给大家作为一个参考。一个合适的文本文件浏览软件是必不可少的,windows自带的实在是没法看。推荐看个人兴趣和习惯nodepad++、sublime text、ATOM和UltraEdit都还不错。
编程语言基础一定要打牢,可以选一门合适的语言。生物信息有很多方向,做数据库的话可以学习PHP和JavaScript之类,做预测算法、数据分析之类个人更喜欢python一些(参考教程:廖雪峰python教程,小甲鱼python入门),分子医学搞研究通常主要是简单分析和画图,用R语言就基本足够了(参考书籍:R语言实战),鉴于很多分析软件都只能在linux环境使用,建议学一下常用的linux指令(参考书籍:鸟哥的私房菜)。我一开始学的perl语言(参考书籍:perl语言入门),用了一年改用python之后就基本没摸过perl了,后来做数据库学过一点PHP和JavaScript,R语言也会一点,属于没有百度就写不出代码的那种类型。不管是哪类编程语言,找一个项目(不管是自己课题组的项目还是网上的示例项目)实操一下,进步很快。
为什么要强调编程语言基础呢?因为个人在实际做项目时,所用的软件包经常可能是各种代码写成的,一个没注意好就会报各种乱七八糟的错误,这个时候如果对编程语言不了解,经常就完全不知道怎么办。即使是在生物信息平台这种地方,虽然可以问师兄师姐,但这一方面会限制自己对这类问题的理解,另一方面也会不断消磨师兄师姐的耐心,说不定什么时候就甩你一句不懂就百度谷歌,自己查。我大概花了一个月时间用perl语言重现了实验室的GPS算法,在这个过程中基本了解了常用的perl语言编程内容。当然,这个并不算快,在我自觉还不错的时候,齐哥说他当时一个星期就搞定了。唉,人比人啊!
在学编程语言的同时,也要开始做其他准备了。最新的生信分析相关文献要常读,推荐文献鸟Stork文献订阅工具,手机电脑都可以用,电脑是推送到邮箱。我每天早上来实验室第一件事就是打开当天文献鸟的推送,过一遍相关的文章,遇到感兴趣的就下原文读一读。各种组学数据的测序原理,分析流程也可以先做了解,慢慢尝试。我初学的时候没有什么借鉴,大都是遇上什么数据要处理就去学习这种数据相关的测序原理和处理流程,现在已经有很多公众号经常有推送了,像小张聊科研、生信宝典、解螺旋、生信技能树之类,当然还有我们生物信息平台新推出的食蟹生信客,日常推送生信分析相关工具和技术。此外,生信技能树还有大批已做好的各组学分析视频在b站上公开,大家可以根据自己的需要有选择的学习。
初学生信不要急,按上述说的积累一年左右,期间做点小项目,思考文献的分析方法,培养自己的生物信息分析思维。这之后再上手任何数据,都很容易触类旁通。
最后也是最重要的,“不懂就问”,但是这里的“问”是指问百度和谷歌,实在不懂再问人!你能遇到的问题基本网上99.99%都会有。如果没有,大概率是没找到,平时多积累相关的论坛,讨论区,小工具,博客之类。