首页 理论教育 生物信息学常见概念:生命科学基础研究入门

生物信息学常见概念:生命科学基础研究入门

时间:2023-10-30 理论教育 版权反馈
【摘要】:生物信息学不仅是一门新学科,更是一种重要的研究开发工具。从科学的角度讲,生物信息学是一门研究生物与生物相关系统中的信息内容和信息流向的综合性系统学科。通过生物信息学的计算处理,人们能更好地从众多分散的生物学观测数据中获得对生命运行机制的系统理解。利用生物信息学对大量数据资料进行分析,人们能在该领域寻找到相对正确的研究方向。其主要的工具和方法包括生物信息学、遗传分析、基因表达测量和基因功能鉴定等。

生物信息学常见概念:生命科学基础研究入门

(一)生物信息学(Bioinformatics)

生物信息学融合了生命科学和数理科学,它以核酸、蛋白质等生物大分子数据库为主要研究对象,以数学、信息学、计算机科学为主要研究手段,以计算机硬件软件计算机网络为主要研究工具,对广大的原始数据进行储存、管理、注释、加工,使之成为具有明确生物意义的生物信息;通过对生物信息的查询、搜索、比较、分析,从中获取基因编码、基因调控、核酸和蛋白质结构功能及其相互关系等理性知识,在大量信息和知识积累的基础上,探索生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡等生命科学中的重大问题,搞清楚它们的基本规律和时空联系,建立 “生物学周期表”。

生物信息学不仅是一门新学科,更是一种重要的研究开发工具。从科学的角度讲,生物信息学是一门研究生物与生物相关系统中的信息内容和信息流向的综合性系统学科。通过生物信息学的计算处理,人们能更好地从众多分散的生物学观测数据中获得对生命运行机制的系统理解。从工具的角度讲,生物信息学几乎是今后有关生物(医药)研究开发所必需的工具。利用生物信息学对大量数据资料进行分析,人们能在该领域寻找到相对正确的研究方向。

(二)基因组(Genome)

基因组概念最早由植物学家Hans Winkler提出,被用来描述所有染色体的集合。目前基因组被定义为一个细胞或者生物体所携带的一套完整的单倍体序列,包括全套基因和间隔序列。

基因组学(genomics)是研究生物基因组的组成状况,以及其各基因的结构,彼此间关系及表达调控的科学。基因组学具有鲜明 “整体性”,即从基因组的层次阐述基因特点,包括基因在染色体上的位置、结构、基因产物的功能及基因与基因间的关系等。其主要的工具和方法包括生物信息学、遗传分析、基因表达测量和基因功能鉴定等。

(三)转录组(Transcriptome)

转录组即DNA转录后所有mRNA的总称。由于mRNA在不同组织、不同状态的表达水平存在明显的差异,因此,转录组测序可用于发现不同生理或者病理状态下的细胞、组织或个体内差异表达的基因;可预测SNP位点及可变剪接,发现新的mRNA isoforms,ncRNA等;也可广泛应用于疾病发病机制的研究,及药物靶点、临床诊断分子标记的筛选。

(四)蛋白质组(Proteome)(www.xing528.com)

蛋白质组是细胞或组织表达蛋白质的全部集合。定义该集合方便了研究,同时强调了蛋白质之间的相互联系。

蛋白质组学(proteomics)研究的是一个生命体在其整个生命周期内所拥有的全部蛋白质,或者在较小的规模,即特定的时间和空间(如某类型细胞在特定时期经历特定刺激)所拥有的全体蛋白质,包括表达水平、翻译后修饰、蛋白互作关系等特征,从而在蛋白质水平上获得对生物体生理、病理等过程的全面认识。蛋白质组学可以大致分为结构蛋白质组学和功能蛋白质组学两方面。

(五)基因本体论(Gene Ontology,GO)

基因本体论描述基因的本质,它一般从细胞组分(Cellular Component,CC)、分子功能(Molecular Function,MF)、生物学过程(Biological Process,BP)三个方面对其进行阐述。简单地说,GO类似于给基因贴标签进行的注释。GO的术语是分层的,呈现出树状结构,而CC、MF和BP为GO术语的最顶层。

(六)通路分析(Pathway Analysis)

一个生物学过程的实现涉及许多蛋白质,而将这些蛋白质合在一起就形成一个通路。通路分析能够更好地帮助人们了解某个或某些蛋白质在一个生物学过程中所扮演的角色。最常用的通路分析数据库是京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)。KEGG数据库是手工绘制的KEGG途径图的集合,每个途径图包含分子相互作用和反应的网络,并将基因组中的基因与通路中的基因产物(主要是蛋白质)连接。KEGG pathway analysis是将目的基因定位到KEGG途径图中的过程。如图3-1为阿尔茨海默症(AD)的KEGG途径图。

图3-1 阿尔茨海默症(AD)的KEGG途径图

基因其实是一串DNA,它的功能和结构都是客观存在的,基因注释能够合理描述这些客观存在的物质,以便理解,通路分析和GO都可以对基因进行注释。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈