尽管大规模的转录组与蛋白组的研究吸引了一大批的研究者,但这两者在实际应用的过程中仍然有很多的不同点。现在的转录组研究通常是对生物体的mRNA进行自动化的、高通量的分析。但是对蛋白组来说,分析常常受到各种各样因素的限制,比方说蛋白质的丰度、疏水性、稳定性、大小及电荷等。如果研究人员对实验进行精心的设计和解释,转录组与蛋白组的数据可以进行详细的比较分析。在未来的研究过程中,类似于蛋白质不同的剪接模型,转录后修饰以及数据整合等方面的研究将受到很大的挑战。
一个人进入疾病状态说明了他体内的蛋白质的表达水平发生了显著和敏感的变化,其中有些蛋白质是疾病发生的原因,另外一些是疾病发生的结果。一个人的生理是一个相当庞大和复杂的系统,包括了无数的调节和反馈机制,使个体能够对内部和外部的一系列刺激产生反应和适应。理解一个疾病的分子机制对于找到一个疾病的安全与有效的治疗方法是最基础的工作,而疾病过程中的RNA和蛋白质的表达谱的研究对上面的理解过程是非常重要的。大规模的基因组测序以及一系列的高通量的分子技术的运用为人们对基因型、RNA表达(转录组)、蛋白质表达(蛋白组)的研究提供了有效的手段,因此也为医药和生物学的发展提供了系统的方法。但实际上,孤立的运用其中的一种技术并不能让我们对生理与病理状态有一个完整的了解,找到一个能够整合各种技术平台上的数据的方法将有助于解释生物的复杂性,从大量的网络信息资源中提出有意义的假设。
整合不同类型的信息并没有想象的那么简单。比方说,人们早就发现,mRNA的表达量与蛋白质的表达量并不能完全对应起来,因为转录与翻译是两个不同的生物学过程,RNA转录以后还要经过一系列的过程才能得到有功能的蛋白质,例如RNA和蛋白质的周转、翻译后修饰、蛋白质构象变化以及蛋白质水解等等。加上实验技术的限制,造成转录组与蛋白组上数据的差异。
这篇文章除了介绍转录组与蛋白组研究相互结合的困难性以外,同样指出了一些在当前阶段已经把两者联系起来研究的好的范例。
Current Opinion in Biotechnology, 2003, 14:6:647-651 详见原文