在后生动物(metazoan)的基因组内,除了蛋白编码序列和少量已知的调控序列,我们对大量的非编码序列感到“无知”。我们不知道任何一个基因组调控序列的具体比例,我们不知道是什么决定了调控序列相对于编码序列的的大小,距离和方向,我们同样不知道对任何一个调控序列,到底什么转录因子与之结合。所以说,研究调控序列与基因组结构的关系将面临很大的挑战。
很显然后生动物的基因组中不管是基因或是非基因的区域都被很好的组织起来,例如中心粒,端粒,常染色质与异染色质,有碱基组成偏爱性的区域isochore,高度保守、受严格调控的基因簇Hox等等。但是同时对大多数的后生动物基因,我们并不知道它们是如何组织起来的。
为了研究后生动物中调控基因与基因组结构的关系,科学家门选取了线虫和果蝇两种生物的基因组进行研究,他们发现,基因的密度与基因的调控复杂性有密切的关系,基因与基因之间的非编码区的长度直接和基因的调控复杂度成正比。因此,基因的调控信息在一定程度上影响了基因组的结构(基因间距离)。
参考文献:
Craig E Nelson* , Bradley M Hersh* and Sean B Carroll
The regulatory content of intergenic DNA shapes genome architecture
Genome Biology 2004, 5:R25
http://genomebiology.com/2004/5/4/R25/