那么,究竟什么是“垃圾”DNA呢?其实它是相对基因而言的。基因是具有遗传效应的特定DNA序列,通俗地讲,基因就是编码某种蛋白质的一段DNA。它们就像散落于天幕的星星一样,分散在我们的基因组中。而在这些基因间存在的大片大片的DNA片段是不能编码蛋白质的,即“非编码序列”。由于功能不清,加州理工学院的大野·乾于1972年提出用“垃圾基因”的概念来形容它们。“垃圾”有多少呢?21世纪之初时,科学家还估计人类基因组(人类全部遗传信息的总和)大约有10万个基因,但不到5年的时间,这一数字已经迅速跌至2~3万个,所以基因包含的DNA序列只占人类基因组总DNA序列的2%左右,也就是说,在人类基因组中,有98%的信息是看似无用的“垃圾”。
虽然,物种的复杂性与基因组的大小、基因的数量并没有绝对的联系,比如,一些两栖类动物以及鱼类的基因组比人类大很多,人的基因数量比水稻的少很多。但是人类如此大的基因组却只有2%的空间给基因,未免太小气了。反过来,这么少的基因耗费了如此大的基因组是不是太过于浪费啦?那么,在学术界和新闻媒体中广为流传的“基因的墓场”是真的吗?经过漫长岁月的进化,许多“垃圾DNA”序列被顽固地保留下来,这是不是在暗示它们有着不可或缺的功能?“垃圾”DNA对生物意味什么?海量“垃圾”的存在引发了科学家们浓厚的兴趣并重拾对“垃圾”序列的关注,也掀起了一场声势浩大的从垃圾中寻宝的浪潮。
科学家们已经发现:“垃圾”DNA的功能之一就是调节基因的活动,如同一道指令一样,控制着基因。一些控制基因开和关的特殊蛋白(转录因子)能特异识别基因附近的非编码“垃圾”DNA,通过与它们相互作用参与基因的抑制与激活。科学家还发现,大多数基因的开启和关闭是由附近的“垃圾”DNA控制的。它们就像是基因的“分子”开关,调节基因的活动。例如,在酵母中,大约30%基因上游的非编码DNA在基因调控中发挥作用。在拥有更大基因组的哺乳动物中,虽然特殊的有功能的“垃圾”DNA的分布要比在酵母中分散,但却在编码蛋白序列的上下游区域内呈簇分布。特别在人中,许多的“垃圾”DNA序列的变化与复杂疾病如关节炎、共济失调症等的发生息息相关。不同个体对药物的反应、对疾病易感性的差异在很多情况下也是由一些特殊的“垃圾”DNA调节的。甚至一些科学家猜想:可能正是“垃圾”DNA造成了人类个体间的差异。
在“垃圾”DNA家族中,还有一类特殊的群体,称为假基因。假基因与基因很像,但却不能产生功能性蛋白,常常被归类为“垃圾”DNA。科学家预计,人类假基因的数目竟然与正常基因的数量相似,大约有2万个左右,目前鉴定的已超过12000个。虽然假基因不能合成蛋白,但并不是说,它们不具有任何功能,研究发现“假”基因确有真本领。研究人员在对小鼠进行遗传改造的时候偶然造成了一个假基因的缺失,该小鼠的后代发生严重的先天性缺陷,并且寿命急剧缩短,可见这种假基因的作用不可小视,它对健康生命是必须的。该假基因是其对应的基因Makorin1的缺陷拷贝,长度不到其一半大,只能产生小分子mRNA(蛋白质合成的中介物),却不能合成蛋白质。尽管很小,但是这种“假RNA”有保护真基因免受破坏的功能。如果这个假基因在小鼠或者人类细胞中丢失的话,真基因的功能也不能正常发挥。研究人员推测,可能是由于假基因RNA看起来像Makorin1,它们掩护真基因,通过“牺牲”自己将不利因素引开,而保护真基因免受干扰。这可能是一种新的基因调节的方法。
“垃圾”DNA还能通过合成调节性RNA发挥功能。这些RNA并不是为了合成蛋白质,但却在生命的舞台上扮演着不同的角色。迄今为止,细胞中的rRNA、tRNA、snRNA、asRNA、snoRNA、miRNA、piRNA都是非编码“垃圾”DNA合成的。它们参与到基因活化、基因沉默、基因印记、剂量补偿、蛋白合成与功能调节、代谢调控等众多生物学过程中。2001年,芬兰科学家凯缇那领导的课题组发现了一个“垃圾”DNA区域,它合成的RNA可以与蛋白质结合,生成一种在线粒体中发挥作用的酶。当这个非编码RNA的关键位点发生变异,个体的健康和寿命都会受到威胁。
此外,“垃圾”DNA中还存在大量的重复DNA序列,这些DNA看似没有意义也不能编码蛋白质,却能形成特殊的DNA高级结构,并以此调节附近基因的活性。
“垃圾”DNA各式各样功能的发现使我们陷入思考:人类的遗传物质真的“垃圾”成堆吗?我们已看到冰山一角,给出一个清晰的答案也只是时间问题。天文学家发现:除去日月星辰的光辉,遥远的银河并非那么的空洞与虚无,璀璨的星光下存在大量的暗物质与暗能量,它们控制着宇宙的运动。如今,这一宏观领域发现的现象也在生命科学最微观的领域得以重现:人类基因组中约98%的看似无用的遗传物质信息正向我们展示着它强大的功能。“垃圾”DNA正在绽放出耀眼的光芒,“垃圾”正在迎接它变废为宝的一天!