公司里那些生物信息分析者都是半路出家吗?

那些本科完全和编程、计算机不沾边的人,是如何在生物公司成为生物信息分析的中坚力量,例如自己去写很复杂的脚本。最近了解到有好些这样的人,甚为佩服啊
关注者
172
被浏览
48,480

9 个回答

题主觉得“编程”、“计算机”是靠老师、学校教才能学好的么?这两样恰恰转行生物信息最容易做好的(因为重要的是累积经验),真正有难度的是反而是数学、统计,这两样缺少正规训练,会直接影响日后能走到的高度。满屏公式的统计文献你都不忍打开的话,光会写程序调API是弄不懂原理的。

另,半路出家也缺少软件工程的训练,代码的版本控制没有,可维护性也很差。复杂的脚本,往往是因为写的烂。

以上两点,是95%的生信分析人员留给我的印象。

我比较赞同 @Tang Boyun 的回答,“编程”、“计算机”这东西的确靠自学,因为代码结果摆在那里,没有争议。无非就是熟练度的问题,还有理解力的问题。

我学perl的时间也就两天,然后就开始各种数据转换,各种小程序一写一大堆,毫无压力。可是呢,碰到真正的生物信息本质问题我就傻眼了,因为我压根不懂高级统计,

会的只是大学学的皮毛,我不知道搞个差异基因那些cuffdiff,DEseq,edgeR,bayseq区别是什么。我只知道如何去用,如何把流程跑好,如何得到漂亮的结果。

RNA-seq差异表达基因分析方法探索

对检测RNA-seq数据中差异表达基因的统计方法的一个比较

满屏公式的统计文献我压根不会看,但是这样丝毫不影响我作为小生信公司的技术主管的地位,因为我不管什么软件,十分钟就上手,随便进行任何数据转换,我熟悉大部分的生信数据库

什么ncbi,ensembl,ucsc,omin,GO,KEGG,uniprot,pfam,IMGT,TCGA,GEO我都有所了解,来了项目,无法就是这些数据库的比对,发现对客户有价值的信息呗

我几乎不写复杂的脚本,90%的代码不超过10行,但是非常精简,高效率,是分分钟就可以写成一堆数据转换的代码,适应任何软件的需要,适应大多数统计画图的需要。

递归,分而治之,折半查找等等基础算法我都懂,看一眼就会实现,凡是我用过的软件只要给我时间,我都可以仿照着实现它的功能。比如fastqc,samtools,bowtie我都仿照写过, 在我的博客里面有具体代码及思路。

但是涉及到高级链表图论我就晕了,但这也丝毫不妨碍我在生信公司从事科研服务,更不会妨碍我带我的菜鸟团们继续在生信的高峰上攀登。

然后就要简单讲讲国内生信本科或者硕士了,首先我不排除有极个别天资及勤奋度都不错的黑马,但是绝大部分都是普通人, 普通人是什么概念呢。就是了解生信是什么,但是如果要做项目就需要再具体一个个概念深化,统一。

最后,在我自己看来,大部分生信公司的哪怕是老总,也只是菜鸟,但是又如何呢。社会需要什么?神?错。菜鸟足矣!

当然,我个人是不会满足于菜鸟这个水平的,也不会止步于此,但是,首先得确保自己菜鸟的身份嘛!