昨夜西风凋碧树
2019年6月11日,那几年刚参加工作的我非常迷茫,抱着小本子找到自己非常喜爱的老师,想写一篇综述,请教是否有建议的方向。他笑着跟我说,你看看组学感不感兴趣。
那不是我第一次听到“组学”这个词,却是这个词第一次走入我的内心。
我开始查资料,发现有个学科,紧紧围绕着组学。这便是我和生物信息学的第一次相遇。
初步了解后决定试着走这条路,开始阅读樊龙江的厚本《生物信息学》。
无言独上高楼
2019年7月,报班参加集训,第一次上课接触Linux,那是我第一次接触命令行界面,这些以往对于我神秘得像隔着无形屏障的事物,开始逐步揭开面纱。
2019年9月,在MOOC上听课。山东大学和北京大学的《生物信息学》都很适合入门,山大简单易学丰富有趣,北大更加系统有算法等内容,从浅入深,学起来更加容易。当时觉得深奥难懂,尤其北大的算法内容,但如今回想起来,学习这些概念性的知识,比如文件格式、数据库等,和真正做项目比起来,已非常浅显,却是必不可少的环节。
2019年11月,学习科研写作。在B站上搜索博士在读或者高校老师的科研科普(分享)视频。学习优秀的科研工作者是怎么做科研的,怎么查找文献,怎么筛选文献,怎样管理文献,寻找idea和平衡生活。
2019年12月,到武汉学习基因组与比较基因组,很可惜,没试着上手。(谁能想到2个月后,武汉这个城市牵动了全国的心,这个城市发生的故事也让时代加速朝前奔涌)
2019年12月,读完《Bioinformatics Basic Skills》,这本书包含了数据格式和处理操作,还有些linux和计算机知识。
2020年1月,学习shell处理数据(进阶),读完《Linux命令与shell编程脚本大全》,学习Cousera《Introduction of Genomic Data》。
2020年2月-3月,疫情隔离在家,Python基础,学习《生物信息平台搭建》和廖雪峰《Python教程》,学会用markdown。
2020年4月-5月,写综述和浪费时间。
2020年6月,学习R,主要学ggplot2作图,会用R作图。哈佛经典的CS50,尝试用这门课计算机入门。
2020年10月,工作和英文写作课《Writing in the Science》。
2020年11-2021年1月,比较基因组预实验。这是我的第一个生信项目。与此同时,进行python针对于生信的学习(之前只是基础),能够简单写一些fasta和gff的小脚本。
2021年3月9日-2021年4月23日。完成基因组学文章初稿,加入基因家族鉴定、分歧时间和基因家族收缩扩张分析。但是我看了更高水平实验室的文章,认为自己能做能学的还有很多。至此,才算是生信的入门。
望尽天涯路
一路走来,我也不知道自己是什么时候下定决心把生信这条路走下去。只知道,完成一个项目,就会更喜欢生信一点;听完一次报告,就会更激动一些。直到突然有一天,我发现我的B站账号、关注的微信公众号、书、电脑……全是生信相关的内容。
从刚开始的迷茫,把生信当作救命稻草;再到后来的专注、发现了里面的趣味,对其前景的肯定;至于现在的期盼,盼望着多学一点,多了解一些。
直到两年后,把碱基矿工的入门帖子再看一遍,我才有所了解这一路都是为了什么,去向何处。
阶段1(过去):
- Linux,shell
- R,python,直至C/C++
- 软件,数据格式转换
阶段2(现在):
- 实操,构建一个流程
阶段3(未来):
- 统计学:掌握数理知识。
- 算法:学习一些几本的算法,知道哪些软件基于什么算法。
- 看源代码:常看他人写好的代码,尤其是好的软件的源代码。
- 机器学习: 基本的机器学习知识,了解机器学习应用于生物的方向和内容。
- 提高英语写作水平:怎样用优美简洁准确的语言表达,使用overleaf写文章。
- 前沿文章成果:学习前人的经验。
- 参加学术会议:科研不是闭门造车,需要和优秀的同行保持一致,更多出去社交让同行了解自己。
补充——分享一下近期的心得:
1. 科研的整个流程:
- 有一个模糊的点子:
可能来源于文章、课题组、老师、同僚、生活等 - 查找文献
把点子映射到一组一维关键词(一维就是足够扁平,清晰) - 下载文献
- 筛选文献:
根据自己的想法对文献进行筛选,留下自己认为可复刻还原的文献,以及瞻仰但是目前条件达不到的文献。与此同时留意哪些期刊会成为自己的潜在目标 - 确定实验设计:
仔细阅读文献方法和结果图,很多篇后,会得到一个套路,把套路套在自己的idea(实验材料)上,看是否可行,是否有科学意义 - 预实验:
预实验有两个作用。第一是熟悉实验技能,在生物学里,是走一次流程;第二是测试自己的点子是否走得通 - 实验:
开始正式组实验时,一定要记录好参数、细节、软件、版本、数据来源等等。 - 分析结果:
跑出来的数据结果要怎样展示,怎样展示才能明显表达出实验意义,怎样才更漂亮 - 写作和投稿
根据自己的潜在目标期刊来撰写文章(根据之前看的文献,要对自己最高能投哪儿,最低下限在哪里,有个把握)
2.同行衬托很重要
不管干什么,一定要了解同行在做什么,做的怎么样,做到哪里了。时不时拿出来比较一下,我发现科学界的“攀比心”比其它领域要重得多。不过想想也能理解,这是科研本身的性质导致的。
3.效率比时长更重要
其实我在学习生物信息的过程中,懒惰和恐惧也曾阻碍了我的前进。比如我的第一篇英文,我就怎么拖着都无法沉下心来写。直到我发现,原来真正认真去写,每天只需要4个小时沉浸式写作,一个月不到就能写完整篇文章。而且随着越来越熟悉领域和技巧的熟练,这个时间还可以越来越短。只要完全聚精会神的去做,一天里,完全可以拿出一个时段去休息。
4.家人和爱人的支持是幸福的终极奥义
而立之年将至,学习不再仅仅是一腔热血,每一次花费的时间和金钱,都需要平衡家庭和工作。幸运的是,我的爱人和家人一直无条件支持着我。
当诗和远方以目标,爱和家人在身侧,学习的些许费劲,不过是幸福的调味品。