冬日的暖阳穿过研究室的窗户照到玛修背上,无视室外零下十二度低温的事实蒸着微微暖意。玛修左手食指轻敲上午刚刚送来的硬碟外包装,右手食指蜷曲着用第二节指节撑着颧骨末端,右手拇指则勾住他外扩的下頷。他盯着眼前的双萤幕,因为一再出现的一组数字微微皱起眉头。
硬碟里的资料是他先前委託外包厂商,进行斑马鱼基因定序的成果。因为基因样本量很少,厂商会先将原本的dna样本用酶切断、进行聚合酶链式反应(pcr)后才定出序列。因此玛修收到的资料是数万,甚至数百万串不等长、由代表不同硷基对的字母排列而成的字串。他必须将这些零碎的字串比对拼贴,最后现出序列原本的样貌。
不过这并不是让他皱眉的原因。定序的技术和重组字串的方法已经非常成熟了。像斑马鱼这种被研究透彻的模式动物,要出大紕漏并不容易。
让他感到担忧的事情是斑马鱼粒线体(mitochondrion)的基因序列长度和线虫的一模一样。
当然不是指原始序列本身的长度一模一样。相较于细胞核的基因序列,粒线体的基因序列突变得更快,而且突变速率稳定,时常被用来评估生物的演化进程以及物种间的亲缘关係。线虫和斑马鱼两种生物天差地远,牠们粒线体的基因序列自然不同。
问题出在玛修手边的理论。他正在研究粒线体基因序列的突变与演化。如果粒线体的内共生假说──我们的真核生物祖先在二十亿年前收服了一种原核生物当「小弟」──是正确的,那么现在所有生物的粒线体硷基排列应该都源自同一条序列。由此,玛修和他的导师正着手建构一种演算法,希望能直接从生物当前的粒线体基因序列推算始祖序列的型态,并依照两者之间的差异将各个生物安在演化树上的相对位置──实现生物演化树的大一统。
可是当玛修完成第一版演算法,并且尝试代入资料库中的已有的粒线体基因序列资料,他发现每种生物最后给出的始祖序列长度都一样──12,317±1对硷基。
不只线虫和斑马鱼,果蝇、文昌鱼和小鼠都一样。现在就连使用他们实验室自己培育的斑马鱼的基因序列进行分析,结果也还是完美的12,317对硷基。
完美的结果难道不完美吗?
当然不!玛修用的方法看来复杂华丽,可是脱不出成山的假设和它外插的本质。不同的物种应该要得出大致相同但细节迥异的结果。不停出现同一组数字,在同儕审查中只会被视为程式码出错的徵兆。
不过他已经花了三个月,一行一行、一字一字检查他的程式码不下数遍。他甚至邀请了国外另一间大学的研究团队依据他的理论进行独立研究,由文化背景迥异的研究员从头实现一次演算法,得出的结果还是一模一样。
那天晚上他又到了校园附近的酒吧买醉,不过身旁喧闹着的、无忧无虑的大学部学生让他愁上加愁。他趁着醉意打电话给前女友诉苦。前女友没有接,他就一直打、一直打……
「都做到这样,你把文章送出去就是了。」
玛修想和前女友復合的奋斗故事说到一半被无情打断。他沉浸在回忆里,愣了一会儿才发现爱丽正在等待他的回应。
「什么?」
「我说,你都做到这样了,」爱丽把叉子尖端含进嘴里,用舌尖品嚐沙拉酱汁的酸甜味道,「不是应该先把文章送出去,看看期刊的审查委员有什么意见再说吗?说不定他们根本不在意这种小事。」
玛修有点尷尬,他搔着后脑,说:「啊,现在想起来是这样没错。不过那时候总想着要把研究做得完美。毕竟那篇文章送出去,大概整个生物资讯学都会被翻过来吧?」
玛修用轻松的语调讲着一般研究人员一辈子都不敢奢望的经歷。不过卡琳对于玛修的藉口并不买单,她靠到爱丽身边悄声说道:「他只是想打给他前女友。」
「所以呢?」爱丽完全不遮掩,单刀直入地问玛修:「你前女友有接电话吗?」
「不要前女友、前女友地叫,好像我们一直分分合合纠缠不清一样。」坐在玛修身旁的量子电脑工程师插话:「我们就是单纯朋友。只是大一的时候交往过一个月而已。而且这根本不是重点好吗?」
爱丽耸耸肩改口,看着工程师说:「那玛修在大一的时候交往过一个月的前女友有接电话吗?」
工程师瞪着爱丽不回答。爱丽再次改口:「玛修大一的时候交往过一个月,但声称两人只是普通朋友的前女友有接电话吗?」
工程师翻了一个几乎到后脑勺的白眼,最后才承认:「有。」
「他说什么?」
「他那时候完全喝醉了,背景又吵得什么都听不清楚。我只能听见他在电话里嚷嚷:『为什么是12,317?』、『12,317到底是什么?』那时候我每天都在确认大数因式分解的量子演算法,已经被两个质数相乘弄得很烦了。我跟他说12,317就是109乘113,什么意义都没有,就把电话掛断了。」