1.2 蛋白保守基序的分析
利用蛋白质保守基序在线搜索程序MEME( 种豆科植物及其外类群葡萄的DAGT 基因家族保守基序进行分析,基序预测数设置为20。将得到的保守基序数据文件利用TBtools本地软件[40]进行可视化展示。
1.3 多序列比对与系统进化分析
运用ClustalX[41]对鉴定所得12 种豆科物种及其外类群葡萄的DGAT 家族基因进行氨基酸序列的多序列比对,并利用基于最大似然法的进化树构建软件——IQ-TREE[42]构建其系统进化树,Bootstrap 值设定为1000,以检验构建的系统发育树的稳定性。
1.4 DGAT基因家族的同源性
根据先前研究中构建的豆科植物及外类群葡萄基因共线性的关系[43],并且通过运行本地程序ColinearScan[44]得到的物种间的基因共线性关系,同时结合家族基因在染色体上物理位置的分布情况,确定物种基因组间的局部共线性关系。
1.5 基于转录组数据的基因表达水平
根据已发表的11 个大豆组织的转录组数据[45],比对到大豆Williams 82 v2.0 的基因组上获得全基因组表达水平;然后检测筛选得到DGAT 家族基因在大豆不同组织中的表达量。研究中将转录组数据比对到参考基因组使用一种的比对工具为Tophat2[46]调用 软件 包Bowtie2[47],并 通过SAMTOOLS[48]实现比对数据结果的格式转换,对比之后利用Cufflinks[49]估计了基因的表达量。并搜索得到了大豆DGAT 基因的表达水平;使用TBtools 本地软件[40]进行了可视化比较分析。
2 结果与分析
2.1 豆科基因组中的DGAT基因
图1 豆科基因组中DGAT基因同源拷贝数Fig.1 Homologous copy number of DGAT genes in legume genomeNote:Ai:Arachis ipaensis;Ah:Arachis hypogaea;Ad:Arachis duranensis;Cc:Cajanus cajan;Cia:Cicer arietinum;Gm:Glycine max;Lj:Lotus japonicus;Mt:Medicago truncatula;Pv:Phaseolus vulgaris;Tr:Trifolium repens;Vr:Vigna radiata;Vu:Vigna angularis;Vv:Vitis vinifera
在12 种豆科植物和外类群葡萄基因组序列中进行Blast 序列搜索和结构比对鉴定,一共得到92个DGAT 家族基因(图1)。其中四倍体花生栽培种的基因组中所含的DGAT 基因数量最多,有17 个同源拷贝(来自花生AA 基因组8 个,BB 基因组9 个),其次是在野生型花生AA 和大豆基因组中分别有10个同源拷贝;而在百脉根基因组中仅有3个DGAT基因。四倍体花生基因组中DGAT 基因同源拷贝数明显多于其他物种,主要是因为四倍体花生栽培种是由野生四倍体花生在人类文明的作用下进化而来,而野生四倍体是由二倍体花生野生种(AA 和BB 基因组)在约470 万年前杂交产生[50],因此导致DGAT拷贝数数量增加。同源拷贝数比其他豆科植物多,这是由于相对其他豆科基因组,大豆在~1300 万年前经历了一次特异性的全基因组加倍[29],这就使得家族得到了极大的扩张。在豆科植物中花生种子的植物油脂含量最高21.3%,次之是大豆48.0%[16,51],DGAT 基因在花生中拷贝数最多,次之的是大豆基因组的拷贝数,推断DGAT 基因拷贝数累积可能与种子含油量存在一定的相关性。另外,二倍体野生花生BB 基因组,相比大豆可能更多的是保留了豆科共有加倍产生的重复基因[29],因此拷贝数与大豆相同;这一结果同时也揭示大豆比花生的重复基因丢失率高。百脉根的拷贝数相对其他基因组明显少很多,这主要是因为多倍化后重复基因丢失差异导致。
2.2 DGAT基因系统发育分析
图2 豆科基因组及外类群葡萄中DGAT基因的系统发育树Fig.2 Phylogenetic tree of DGAT gene in legume and outgroup grapes注:树中包括葡萄(Vv),苜蓿(Mt),三叶草(Tr),大豆(Gm),红小豆(Vu),绿豆(Vr),菜豆(Pv),木豆(Cc),鹰嘴豆(Cia),百脉根(Lj),二倍体花生野生型AA(Ad),二倍体花生野生型BB(Ai),四倍体花生栽培种的A 基因组(Aha)和B 基因组(Ahb)鉴定所得的92 个DGAT 基因;不同颜色的基因区块表示由真双子叶植物共有三倍化事件(通常称为gamma事件)[52]产生的三个同源集合Note:The tree includes 92 DGAT genes of Vitis vinifera(Vv),Medicago truncatula(Mt),Trifolium repens(Tr),Phaseolus vulgaris(Pv),Glycine max(Gm),Vigna angularis(Vu),Vigna radiata(Vr),Lotus japonicus(Lj),Cajanus cajan(Cc),Cicer arietinum(Cia),Arachis hypogaea(Ah),Arachis duranensis(Ad),Arachis ipaensis (Ai). Different colored gene blocks represent three homologous groups produced by eudicots having triploid events (usually called gamma events)[52]
系统发育树的构建是发现基因进化速率、分化关系分析的有效方式,这里对外类群及豆科植物中DGAT 基因的氨基酸序列,利用IQ-TREE 构建了其92 个DGAT 基因的系统发育树(图2)。豆科植物及葡萄的DGAT 基因可以分为三个旁系同源集合,由于豆科植物与葡萄共有祖先在大约1.15 亿~1.3 亿年前,共同经历了一次全基因组的三倍化事件[52],在葡萄基因组中存在一组3 个旁系同源基因集合,然而在葡萄和豆科植物分化之后,在葡萄基因组中发生了重复基因丢失,仅仅留下了2 个旁系同源集合分别是Vv14g 与Vv14g 构成的一组旁系同源,在进化中串联重复对于葡萄基因组中的DGAT 基因的扩增起到了重要作用,如基因Vv14g 和Vv14g 发生了串联重复,Vv04g 和Vv04g 同样也发生了串联重复,串联重复使得葡萄基因组中的该家族基因扩张幅度为150%=((5-2)/2)x100%。相比较地,在豆科基因组中3 个旁系同源分支都存在,这表明葡萄基因组中的丢失发生在与豆科物种分化之后。野生型二倍体花生基因组的杂交促进了四倍体花生基因组中DGAT 基因同源拷贝数的增加,尤其是四倍体花生A 基因组中来自6 号染色体的基因发生了串联重复,值得注意的是,其中的一个基因Aha06g0857,在系统发育树中与二倍体BB基因组中的Ai06g2730聚类到了一个分支上,导致这一拓扑结构变化的可能是由于花生A 基因组可能具有较快的进化速率,又或者是基因置换导致。四倍体基因组BB 中的Ahb06g2544,置换了对应在四倍体花生AA 基因组Aha06g2608中的某些DNA片段,这一情况在四倍体亚基因组之间频繁发生[16]。
文章来源:《大豆科学》 网址: http://www.ddkxzz.cn/qikandaodu/2021/0726/716.html