notes
比较基因组学是估计最小基因集合的另一种方法。最初试图确定最小基因集合是由确定保守基因的基因组之间的寄生细菌,支原体genitarium携带468个蛋白编码基因,与小的流感嗜血杆菌基因组,携带1703个蛋白编码基因,结果,两个基因组中有240个同源基因被鉴定为保守基因。尽管Mushegian和Koonin发现在两种细菌中都缺少一些编码基本生化通路成分的同源基因,但两种细菌的基本细胞功能都由非同源基因进行了补充,这种现象被称为非同源基因替代non-orthologous gene displacement (NOGD),在他们的对比研究中发现了22个NOGDs。此外,从最小基因集中筛选出6个功能冗余基因,确定最小基因集为256(240+22-6)个基因。后来,Gil和同事们通过比较几组基因组信息确定了几种细菌的最小基因集:(1)昆虫细菌内共生体中保存的蛋白质编码基因。(2)实验测定的大肠杆菌和枯草杆菌的Essential gene(3)生殖支原体的最小基因集和实验测定了生殖支原体和生殖支原体的近亲肺炎支原体的必要基因(4)金黄色葡萄球菌必需基因的研究和(5)小Phyroplasma asteris基因组,确定了266个基因是最小基因集。最小的基因集包括复制、转录、翻译、蛋白伴侣、运输、糖酵解、atp酶、磷酸酶途径、脂质代谢(不含脂肪酸合成,和昨日笔记类似)、核苷酸合成、辅助因子合成。Gil和他的同事们也指出,这个重要基因的最小集合是暂时性的并且几乎没有相关生命的起源的研究(Gil et al ., 2004)并且,可能实际上很难精确估计原始细胞的基因的最小基因集合。然而,这些分析基于直系同源分析,因此,每一个最小基因集可能含有的高度保守的基因进化信息
另一方面,Acevedo-Rocha及其同事指出,实验确定的大肠杆菌必要基因(Baba等,2006)在171个细菌基因组中的存在率非常低,在所有基因组中只发现了42个基因(14%),这说明从必要基因组中估计普遍的必要基因有很大的困难(Acevedo-Rocha等,2013)。如前一节和本节前面所述,由于基因功能的冗余、NOGD以及实验条件的差异,当用于比较的细菌种类数量增加时,必要基因的存在率较低,这并不奇怪。Azuma和Ota使用KEGG通路图直接估计了最小细胞功能。因为他们识别的是保守的通路,而不是保守的基因,所以NOGD的负面影响可能会减弱。他们成功地确定了由20条保守通路和21条生物特异性通路组成的大肠杆菌的最小通路图。
为了讨论基本细胞功能的保守性,我们基于广泛的细菌基本基因集,在细菌中使用KEGG模块完成比率(MCR) 分析了通路和涉及重要生物反应的功能结构(我们称为:基本模块)的保守程度,(见图1的说明,表S2)。由于每个KEGG模块都由多种通路组成,通过一系列反应产生代谢产物,因此这个分析可以避免由于途径或基因(或蛋白)的替代而产生的负面影响。结果如图1所示。脂肪酸生物合成(KEGG模块编号:M00083和M00082) 、PRPP生物合成(M00005)、辅酶A生物合成(M00120)和糖酵解(M00002)被认为是细菌中最保守的5个基本途径模块(图1B)。糖酵解是将葡萄糖转化为丙酮酸并产生能量化合物(ATP和NADH)的代谢途径。丙酮酸是必要的起始材料的好氧克雷布斯循环和厌氧发酵代谢。丙酮酸也转化为乙酰辅酶A(辅酶A),用于脂肪酸生物合成途径的初始步骤。脂肪酸合成从乙酰辅酶a和丙二酰辅酶a合成乙酰乙酰基- acp开始,然后通过添加丙二酰辅酶a的乙酰基单位延长酰基链。辅酶A生物合成(M00120)对脂肪酸合成也是必不可少的(Magnuson et al., 1993)。5-磷酸核糖合成5-磷酸基-1-二磷酸(PRPP)是核苷酸合成的第一步(Gil et al., 2004)。如图1B所示,排在前10位的其余基本途径模块是核苷酸合成(M00050, M00052)、异戊二烯类生物合成(M00096)和四氢叶酸(THF)生物合成(M00126)。异戊二烯有助于膜稳定性(泰勒,1984)。THF对氨基酸和核苷酸的合成至关重要(Scott和Weir, 1998)
核糖体(M00178)、dna聚合酶III复合物(M00260)、RNA聚合酶(M00183)、f型atp酶(M00157)和脂蛋白释放系统(M00255)在细菌基本结构模块的保守度中排名前五(图1C)。因此,除f -型atp酶外,高度保守的结构模块与遗传信息处理、翻译(核糖体)、复制(dna -聚合酶III)和转录(RNA聚合酶)相关。f -型atp酶可能对产生质子动力和维持pH平衡至关重要(Xu et al., 2011)。其余高度保守的模块在前10位分别是分泌系统(M00335)、细胞分裂转运系统(M00256)、ABC型转运系统(M00254)、脂多糖出口系统(M00320)和RNA降解系统(M00394)。M00335、M00256、M00254和M00320模块与膜转运有关,M00394参与遗传信息处理(Kanehisa et al., 2016)。保守的KEGG基本模组与Gil及其同事确定的最小基因集所编码的通路重叠(Gil et al., 2004),表明最小基因集在进化中被保存为编码基本模组的基因。
有趣的是,E-cell项目表明,代谢途径包括:糖酵解生成ATP、利用外源性脂肪酸生物合成磷脂,转录和翻译机制可以支持代谢的平衡,但不能支持细胞分裂和基因组复制(Tomita et al., 1999;吉尔等,2004)。E-cell项目估算的最小基因集与Gil及其同事的发现有很大的重叠,Gil及其同事排除了编码脂肪酸合成通路的基因,因为脂肪酸可以从环境中获得(Gil et al., 2004)。然而,脂肪酸合成在原始细胞分裂中可能是重要的,因为脂肪酸合成的激活导致的过量膜合成会刺激原始细胞的增殖(见下一节)。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!