完整的代谢组学流程包括样本的采集、预处理、数据的采集和分析及解释。其研究平台主要由技术分析平台和数据分析平台构成。代谢组学力求分析生物体系(如体液和细胞)中的所有代谢产物,所以整个过程中都要强调尽可能保留和反映总的代谢产物信息,如体液(血浆和尿液)中含有几百种小的分子,在植物界有多达200000种代谢产物,都需要进行分析。传统分析低分子量代谢物的方法主要研究特定种类的复合物,分离和探测技术都是针对感兴趣物质的理化性质,分离分析技术要求相对不高。代谢组学分析必须对所有代谢产物进行无偏向选择的全面分析,理论上应该能够检测获得每个个体的代谢谱,然而实际工作中要达到总揽代谢产物组成是非常困难的。
12.3.2.1 代谢组学分析策略
1.代谢谱(metabolic profiling)和代谢指纹(metabolic fingerprinting)分析 目前用于全面分析生物样本中大量代谢产物分布方式和浓度的新技术和方法正在不断发展中。用于代谢组学或代谢谱分析的方法主要是以气相色谱法结合质谱法(GC/MS),液相色谱法结合电喷雾离子化/质谱(LC/ESI/MS),或液相色谱法结合核磁共振法(LC/NMR)。与基因谱、转录谱、蛋白质谱分析技术检测的目标分子是一组相似的化学物(如DNA、RNA和蛋白质)不同,代谢谱分析的是一系列化学本质、分子量和物理性质不同的代谢物。因此,从分析方法的角度来看难度是很大的,且需要使用多种平行方法相结合才能完成分析,而GC/MS、LC/NMR技术在分析生物样本的大量代谢产物方面是有效的。
与转录组和蛋白质组分析所获数据类似,可使用代谢指纹谱来描述和定义代谢通路图、明确整个代谢网络或功能模块的相互作用。值得注意的是,采用目前的技术手段,哺乳动物细胞内的代谢物仅有20%左右能被识别和鉴定。例如,真核生物体内的代谢产物数量据估计有4000~20000种化合物,尽管这个数量是如此之高,但是与数量更高的mRNA和蛋白质相比,利用代谢产物谱可以降低所分析组分的种类。
现在多数情况下是采用1H核磁共振光谱法(nuclear magnetic resonance spectroscopy,NMR)来分析动物和人群研究对象的体液样本,之后将得到的复杂代谢产物谱采用多因素统计分析得到分布模式。利用这种模式识别分析法可以直接分析NMR光谱数据而不需要先确定光谱峰值代表的具体代谢产物,而且可以提供代谢产物随时间变化的情况。一项人群代谢组学研究分析了健康志愿者和不同阶段冠心病病人的血清样本,采用模式识别分析法,根据NMR光谱结果不仅可以判断是否存在疾病,且可以确定疾病的严重程度。
2.代谢物靶标分析(metabolite target analysis)
定性、定量分析与特定代谢反应相关的一种或几种代谢产物。需运用复杂的技术从生物样品中分离纯化特定感兴趣的代谢产物,特别是在物质的检测极限很低时,这个过程是必需的。通常运用色谱与敏感的质谱或与紫外检测器联用。
12.3.2.2 主要研究方法(www.xing528.com)
由于代谢组学分析的对象种类繁多,性质差异很大,浓度范围分布广,要对它们进行无偏向的全面分析,不能只靠单一的分离分析手段。目前代谢组学的研究中最常见的分析工具是NMR,该方法不需要大量的样品提纯,甚至无须提纯,能够实现对样品的非破坏性、非选择性分析,且具有定量分析的特性。但它也有两个非常明显的缺陷,即灵敏度低、分辨率不高,常常导致高丰度的分析物掩盖低丰度的分析物。灵敏度低的问题随着磁场强度不断增加和NMR的检测器改进而有明显改善。但是,对于低丰度的代谢产物分析分辨率差仍是需要解决的问题。
高敏感性加上较宽的测量范围使质谱技术(mass spectrometer,MS),包括气相色谱质谱联用、液相色谱质谱联用、基质辅助激光解吸离子化质谱法及其他以MS为基础的技术等,在分析众多代谢产物中成为强有力的工具,是NMR的很好补充,它能够提供较高的分辨率和检测灵敏度,并且有可供参考、比较的标准谱图库。但是,质谱分析的缺陷是需要复杂的样品制备过程,来自生物样本的低分子量代谢产物在有机溶剂萃取过程中将不可避免地丢失。
今后还将采用放射性核素示踪技术结合质谱和NMR法分析特定代谢产物的代谢途径。在体内首先采用稳定放射性核素标志特定化合物,之后利用质量放射性核素比值分析跟踪大量标志代谢混合物的生物合成,从而可以了解原子通过代谢产物和代谢通路的流向和代谢物通过代谢链的分子开关。利用质子放射性核素分析结合数学运算定量分析细胞内代谢物变化的方法最近在大肠埃希菌的中心碳代谢的研究中得到应用。该方法被证明是可靠的,可以了解大肠埃希菌K12细胞中乙酸和葡萄糖代谢调节过程中涉及的生化改变。目前在营养学领域已经采用了稳定放射性核素技术进行人群代谢过程的研究,用代谢组学结合放射性核素比分析方法评价特定人群代谢放射性核素流量将是今后营养研究的一个重要方向。
12.3.2.3 数据分析方法
在得到分析对象的原始数据后,首先需要对各种分析手段获得的原始数据进行处理,得到可用于代谢组学研究的格式。根据各种分析手段(NMR,GC/MS,LC/MS/MS)自身的特点,对原始谱图的数据进行提取、峰对齐、去噪等处理,然后需要对这些数据进行分析,挖掘隐含于其中的有用信息。
在代谢组学的研究中,大多数情况是要从检测到的代谢产物信息中进行两类(如基因突变前后的响应)或多类(如杂交后各不同表型间代谢产物)的判别分类,因此在数据分析过程中应用的技术也就集中在模式识别技术上。用于代谢组学研究中的模式识别技术主要有主成分分析(principal components analysis,PCA)、非线形映射(nonlinear mapping,NLM)、簇类分析(hierarchical cluster analysis,HCA)等非监督(un-supervised)学习方法和SIMCA(soft independent modeling of class analogy)、PLS-DA(PLS-discriminant analysis)、ANN(artificial neural network)等有监督学习方法。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。