甘油二酯酰基转移酶(Diacylglycerol acyltransferas,DGAT),在动物、植物、真菌和细菌中都存在,是三磷酸甘油(Kennedy)途径的限速步骤,能够催化三酰甘油(Triacylglycerol, TAGs)生物合成,是合成TAG 的关键酶,也是唯一的限速酶[1]。在植物中,DGAT 直接参与TAG 合成,是调控路径中的最后一步限速反应。在拟南芥中,通过DGAT 基因的异位表达,发现能够增加植物种子中的含油量[2]。在拟南芥种子发育的研究中,种子的皱缩和含油量下降也表明DGAT修饰能够影响植物种子发育和种子含油量[3]。油脂作为能源物质可以在植物的生长和发育的过程中提供能量,拟南芥萌发的种子和幼苗中DGAT1 表达量很高[4],大豆发育种子内TAG 合成速率是绿色子叶内TAG 合成速率的两倍[5],表明DGAT对种子胚后发育也有重要作用。目前,根据细胞定位和结构差异,DGAT 分为DGAT1、DGAT2、胞质内DGAT(DGAT3)和蜡酯合成/二酰甘油酰基转移酶(WS/DGAT)四种类型。DGAT1 在小鼠体内首次发现,与哺乳动物的酰基辅酶A 胆固醇酰基转移酶(ACAT)同源[6];DGAT2 在真菌Mortiella Ramanianna中发现[7],然后在其他真核生物中也被鉴定到[8,9];DGAT3 是从花生子叶发育过程中[10]以及后来在其他植物中鉴定出来的;WS/DGAT是催化蜡酯以及甘油三酯(TG)的合成终步骤的限速酶,在植物以及细菌中都有非常重要的作用[11]。
豆科植物是陆地上第三大植物科,包含多种重要的油料作物,共有650 个属,18 860 余种,约占开花植物种类的7%[12]。豆科也一直作为人们的粮食作物,它们的利用与人类进化密切相关[13]。此外,豆科是自然生态系统的重要组成部分,一些豆科植物能够通过与共生微生物的协同作用来修复大气氮[14]。豆科植物中脂类物质的含量也十分丰富,油脂主要以油脂体或球形体的形态存储在豆科种子中。其中大豆和花生中油脂的含量可达到21.3%和48.0%,分别在世界植物油的产量中排第1 位和第4 位[15,16]。植物油脂的改良是油料作物人工培育的重要目标之一,植物脂肪酸和TGA 的合成是植物油脂改良研究的主要途径。随着豆科植物基因组测序的不断完成,为从全基因组分析其重要基因、基因家族结构和功能演化提供了丰富的数据材料。
基因加倍(gene duplication)或称为基因重复在物种进化的过程中起着重要的作用,为基因功能创新和基因家族的多样化进化提供了原材料[17]。基因重复具有多种发生形式,主要有全基因组加倍(whole genome duplication)、片段性加倍(segment duplicaiton)、串联重复(tandem duplication)和逆转录(reverse transcription)。由于逆转录基因缺乏调控区,所以人们普遍认为大多数逆转录基因是非功能性的,并且逆转录在基因家族的扩增中可能起着较小的作用[18]。有大量研究表明,在物种进化过程中全基因组加倍、片段性加倍和串联重复加倍对于基因家族扩张具有重要作用,如对抗病基因[19]、固氮相关基因[20]和在动植物中均有重要功能的一些基因[21]等。由基因重复所产生的旁系同源(paralogy)基因,可能在进化中出现分化,产生不同的功能,也可能丧失功能而在进化中丢失;由物种分化所产生的直系同源(orthology)基因可能存在于不同的物种中,也可能随着物种分化形成而发生差异性的保留和丢失[22,23]。
大豆[24]、玉米[25]等一些重要油料作物在DGAT 家族基因上已经有了一些研究,尤其是在分子生物学实验方面进行了调控机制相关的分析,但对于大豆、花生等重要的豆科物种中还未进行一个全面的分析。本研究通过鉴定已完成测序的12 种豆科植物及外类群葡萄的DGAT 家族基因,进行生物信息学分析,研究其系统发育进化、蛋白质结构域以及共线性关系。
1 材料与方法
1.1 数据的获取
豆科植物和外类群葡萄的全基因组数据从公共数据库中下载得到:其中葡萄(Vitis vinifera)[26]、苜蓿(Medicago truncatula)[27]、菜豆(Phaseolus vulgaris)[28]、大豆(Glycine max)[29]最新版本数据是从JGI 数据库( jgi. doe. gov/)中下载;红小豆(Vigna angularis)[30]和绿豆(Vigna radiata)[31]则是从作物基因组学实验室(Crop Genomics Lab)上下载;百脉根(Lotus japonicus)[32]、木豆(Cajanus cajan)[33]、鹰嘴豆(Cicer arietinum)[34]数据从PGDD 数据库( hypogaea)[35]和两种野花生(Arachis duranensis 和Arachis ipaensis)[36]则是从Peanut Base(
为在豆科基因组中鉴定DGAT基因,从PFAM数据 库( xfam. org/)中 下 载 了DGAT(PF03982)家族基因的隐马尔科夫模型(HMM)。从TAIR( arabidopsis. org/)中获取模式物种拟南芥的全基因组序列,利用HMMER 比对全基因组鉴定其DGAT 基因,设定期望值(E-value)小于1e-10 为界限。利用SMART( /)[37]程序对获得的拟南芥潜在的DGAT基因的典型特征结构域进行验证,最终确定拟南芥的DGAT家族基因。在12种豆科基因组中采用同样的方法鉴定DGAT 基因后,利用E-value 值为1e-10与拟南芥的DGAT 家族基因进行BLSATP[38]序列比对,去除重复后最终得到的基因即为豆科各物种的DGAT家族基因。
文章来源:《大豆科学》 网址: http://www.ddkxzz.cn/qikandaodu/2021/0726/716.html