随笔160825

突然发现又好久没有更新博客了(此时我有一种不想再给这个破VPS 续命+1s的冲动,反正又不怎么写,写了也没人看…)暑假一转眼就要过去了,说好的入门Mma…说好的入门Latex…我好怠惰啊!

想一想还是又很多可以写成博文的东西的,比如上个月研究的Scrapy,还有最近迷上的Scala,以及好久之前给自己写的老婆,和好多好多补番感想…果然是怠惰啊!

fb7df3c166a9b51

其实最近生活发生了一些小小的改变,勇敢地向未知的世界迈出了一步,加入了一间实验室…以后不知道还会不会有自己孤睾地在寝室里补番、撸代码的日子了。这里就谈一谈感想吧。

暑假的第一个月在家里拼命的追番、补番,偶尔看看书、学了一下Scrapy和Pandas,在家实在是太无拘无束了,过的基本就是废人生活… 这一个月飞快地就过去了,8月初就按照之前说好的来到了实验室,第一个星期跟着一个学长学一下分子克隆就是体验一下生物狗生活… 第二个星期那个带我的学长离开了一个星期,就没有再做湿实验。随后我就做了我的第一个生物信息工作,通过测序得到的数据计算出一个蛋白质互作网络,听上去貌似很高大上的样子,其实并没有涉及到高级的算法和复杂的生物学概念,没有工程上的难度也没有理论上的难度。但我还是翻来覆去做了很长时间…

说实话这让我深深认识到了自己有多菜,后来反思了一下,发现了一些问题,首先生物信息数据往往是非常大的,动不动就是几十个G的,并且不容易对程序的输出结果进行验证,这就要求有比较好的测试习惯,我发现自己原来写的一些一些东西都是可以简单粗暴地通过直接跑来debug的,虽然写测试、构造sandbox什么的道理我也懂,但以往从来没有意识到它的重要性,但是对于这样的数据来说不写测试有时候就很难判断算出的结果是否可信,而且对于几十个G的数据,暴力运行来测试显然不可取… 另外就是发现自己不够重视代码的抽象程度,编写的代码复用性很低,没有建立起自己的Library,总之是自己的代码姿势其实还很不行的_(:3」∠) . 现在正在学习 rna seq 的分析流程,又发现自己统计学水平不行、看文献慢,越发感觉自己好辣鸡…

总之,还是有很多要学习一个,来增长姿势水平的东西的,比如统计学、R语言还有怎么用C来给Python写扩展来加快运算,在加上自己仰望了好久的Mma、Latex、docker、spark、scala、、、(此处列表可无限延长…)。当然我从来也不讨厌广泛学习,毕竟在业务范围周边不务正业是我的最爱嘛~