最近导师推荐了一篇综述 “One subgenome to rule them all: underlying mechanisms of subgenome dominance”,该文章于2020年4月发表于Current Opinion in Plant Biology ,这篇综述探讨了基因组研究和分子遗传学的一个主题问题:异源多倍体物种中亚基因组优势的潜在机制。
摘要
异源多倍体是由两个或多个二倍体祖物种杂交形成的,通常经历了亚基因组优势(亚基因组显性),即亲本基因组(亚基因组)中的其中一个具有更高水平的基因表达,并最终比其他亚基因组有保留更多的基因。在一些异源多倍体中,基因附近的低转座因子(TE)丰度与占优势的亚基因组有关,但TEs不太可能是导致亚基因组表达优势的唯一原因。在这篇综述中,研究了TEs在亚基因组优势中的作用,并讨论了亚基因组间的遗传不亲和性如何可能有助于亚基因组优势的迅速出现。最后,强调了几个关于亚基因组优势的问题,这些问题在很大程度上仍未得到回答
什么是亚基因组优势?What is subgenome dominance?
全基因组加倍(WGD)在被子植物的进化史上十分普遍。WGD增加了一个生物体的细胞核内的基因组拷贝数。多倍体可以通过同源多倍化(由单个二倍体物种的基因组加倍而形成)或异源多倍化(由两个或多个不同的二倍体物种的基因组杂交和加倍而形成)产生。
在一个新的异源多倍体物种形成后,新的基因组不稳定,因为先前分离的每个二倍体祖先物种的基因组(称为亚基因组)必须在一个单一的细胞核中相互协调和共存。自最近的共同祖先以来,每个二倍体祖先物种的基因组可能已经进化得非常不同,包括它们的基因与基因的各种相互作用体共同进化的方式也不同。因此,新引入的异源多倍体亚基因组必须迅速解决一系列不同的潜在遗传不亲和性。
为了获得与二倍体更像的状态,多倍体基因组会经历基因丢失(或分异,fractionation)和染色体数目减少。这一过程在多倍体化后立即开始,就像在甘蓝型油菜中发现的那样,并仍以较低的速率在古老多倍体中进行,如拟南芥和玉米。在一个完全中性和随机的模型下,在一个古老的异源多倍体中,不同的亚基因组会经历相似的基因分异率(gene fractionation)。相反,以前的研究表明异源多倍体中的一个亚基因组通常比其他不占主导地位的亚基因组保留更多的基因。此外,研究还表明,与不占主导地位的亚基因组相比,占主导优势的亚基因组保留了更多的基因,整体也表现出了更高的基因表达。与不占主导优势的亚基因组相比,占主导优势的亚基因组还保留了大量的串联重复基因,并通过同源交换取代了不占主导优势的亚基因组的大部分区域。简而言之,基因分异(gene fractionation)程度较低、表达程度较高的亚基因组称为优势亚基因组(显性亚基因组),分异程度较高、表达程度较低的亚基因组称为劣势亚基因组,这种现象统称为亚基因组优势。
值得注意的是,亚基因组优势并不意味着完全优势。劣势亚基因组仍然包含在不同水平上表达的基因,在某些情况下,某些基因比优势亚基因组上的同源基因表达得更高。此外,劣势亚基因组可能在特定的空间和时间环境中表达得更高。下文提供了更多的细节。亚基因组优势是指一个亚基因组整体表现出的优势模式。科研界仍然需要解决一个问题:一个亚基因组相对于另一个亚基因组的基因含量和表达有多少差异才足以被称为亚基因组优势?
亚基因组优势是所有多倍体共有的吗?Is subgenome dominance shared by all polyploids?
亚基因组优势在许多异源多倍体中已被观察到,但不是所有的异源多倍体或任何已知的同源多倍体。这表明,亚基因组间的遗传差异可能是导致和影响主导方向的原因。这在棉花的研究中得到了进一步的支持,在合成的F1异源多倍体和更老的自然异源多倍体中检测了亚基因组优势。这两种基因的表达倾向是一致的,这表明亚基因组优势开始于早期,并受到某些基因组特征的引导,而不是随机事件。
在许多异源多倍体物种中,低TE丰度与显性亚基因组有关。TEs曾经被认为是垃圾DNA,后来被证明是导致植物基因组大小变化和影响基因表达的主要来源。TEs在整个基因组中具有扩大和广泛扩增的能力,它们的插入可以对基因产生有害的影响。因此,为了防止进一步的扩增,大多数TEs会被迅速地表观遗传沉默。有研究表明,基因附近的TEs的甲基化会降低表达。这种基因表达的降低可能是TEs与亚基因组优势相关的原因(Fig. 1)。简而言之,亚基因组间,邻近基因的,甲基化TE的密度的相对差异导致了低甲基化TEs亚基因组的更高的基因表达模式。
当然也有一些明显的例外,亚基因组优势在许多种间杂合体和异源多倍体中被发现。这些异源多倍体的劣势亚基因组通常表现出更高的基因分异率(取决于多倍体事件的年龄)和/或更低的基因表达,与优势亚基因组相比,具有显著更高的TE密度。例如,对最近发布的八倍体草莓基因组的分析表明,TE密度最低的亚基因组在其他三个亚基因组中占主导地位。同样,在自然和重新合成的新异源多倍体猴面花(Mimulus peregrinus)中,邻近基因的TE密度最低的亚基因组占主导地位。
除了在所有被调查的组织和发育阶段被单一亚基因组支配外,在蓝莓、小麦和棉花中有证据表明存在时空特异性亚基因组。分析发现,在异源四倍体蓝莓中,一个亚基因组在几乎所有被研究的组织和发育阶段(包括花期和受精后)都有较高的基因表达量,而另一个亚基因组在果实发育期间表达量最高。在异源四倍体棉花中,利用不同器官进行基因表达分析的研究发现了不同的优势亚基因组。例如,Flagel等人发现D亚基因组是优势的,并且在花瓣中表达得更高。然而,Yang等人发现A亚基因组在胚珠组织中表达更高。这些例子表明,亚基因组之间整体TE丰度的差异并不是亚基因组优势的唯一潜在原因。此外,它强调了研究亚基因组表达优势在各种器官、组织、细胞类型和发育阶段的重要性。
同源多倍体,如杨树,不表现出亚基因组优势,可能是因为重复的亚基因组是相同的。然而,也有不表现亚基因组优势的异源多倍体的例子,如葫芦和荠菜。对于这些多倍体,不同的亚基因组具有相似的TE密度,杂交前的祖细胞可能高度相似。而对于其他不表现出亚基因组优势的多倍体物种,如大豆和梨,尚不清楚古老的WGD是两个近缘物种之间的同源多倍体事件还是异源多倍体事件。这表明,TE含量和各亚基因组之间存在的遗传差异都与亚基因组优势有关(Fig. 2)。
亚基因组优势的原因是什么?What causes subgenome dominance?
如上所述,甲基化TEs可以降低附近基因的表达,这可能是由于甲基化效应和/或相关的染色质重塑降低了转录因子的可及性。在沟酸浆属(Mimulus)中,最初种间杂交后TEs的甲基化重新形成反映了附近基因的表达水平,为TEs甲基化与亚基因组表达优势之间的联系提供了进一步的证据。换句话说,亚基因组间基因表达水平的变化可能是由于TEs的甲基化,而不是TEs本身(Fig. 1)。因此,虽然甲基化TEs对基因表达的影响可能会导致亚基因组表达优势模式,但未甲基化TEs预计不会对附近基因的表达产生负面影响。如果两个亚基因组附近的TE水平存在显著差异,但这些TE未被甲基化,我们就不会观察到基因表达差异,因此也就不会观察到亚基因组显性。这将产生类似于同源多倍体和异源多倍体的模式,它们的亚基因组具有相似的TE水平。
亚基因组优势也可能受到经历遗传不相容的细胞的影响,包括协调不同的调控、信号和代谢网络,从合并不同二倍体祖物种的基因组到一个单一的细胞核。杂合化过程中,复杂的调控网络可以被破坏,包括顺式和反式调控元件(Fig. 2c-f)。通路和复合物的高剂量敏感成分的破坏会对适应度产生负面影响,甚至是致命的。因此,一个亚基因组相对于其他亚基因组的优势可能解决这种遗传不亲和性,但必须在第一代内非常迅速地发生。一个可能的结果是,特定的通路子集由一个亚基因组控制,而其他亚基因组控制其余的途径。这将导致表型性状被划分到不同的亚基因组,就像蓝莓、棉花和小麦所观察到的那样。然而,优先沉默一个亲本亚基因组而不是其他亚基因组的潜在机制仍然不清楚。此外,还需要研究重新合成杂交体和多倍体亚基因组中最早世代染色质和DNA甲基化状态的变化。
亚基因组优势的确定性如何?How deterministic is subgenome dominance?
在自然形成的棉花和猴面花异源多倍体中占主导地位的亚基因组在一组重新合成的种间杂合体和异源多倍体中也显示出优势。此外,亚基因组表达优势已被证明在最初的F1杂交,并在随后的几代增加。因此,这就提出了一个问题,亚基因组优势是否在某些杂交和/或多倍体物种中是预先确定的。据我们所知,这还有待于适当的评估。我们假设环境可能影响亚基因组在某些杂合体和异源多倍体中成为优势。处于劣势(或服从)的亚基因组可能更适应特定的环境,因此选择可能有利于它在某些或所有时空环境中显性表达。
在种间杂交中,近基因和TEs内的CHH (H对应于A、T或C)位点的DNA甲基化在种间杂交中显著减弱,如猴面花。新形成的特异杂交品种中CHH甲基化水平的下降可能是由于RNA定向DNA甲基化(RdDM)途径的遗传不亲和所致。虽然新的杂交或异源多倍体基因组试图在基因组冲击后恢复CHH位点的稳定性和DNA甲基化水平,但环境可能在基因表达显性向特定亲本亚基因组的方向和幅度方面发挥重要作用(假设环境能提高适应性)。
围绕亚基因组主导地位还有哪些其他重大问题呢?What other major questions still surround subgenome dominance?
亚基因组优势是由二倍体祖细胞中存在的甲基化模式差异决定的,还是由多倍体化后DNA甲基化的重复模式决定的?在多倍体形成后,DNA甲基化水平是否总是以亚基因组特定的方式发生显著改变?由于TE含量和DNA甲基化水平在物种水平上的差异,必须在分析中包含参与多倍体形成的确切个体,才能真正解决这些问题。因此,利用绝大多数自然形成的和/或古老的多倍体来解决这些问题是不可能的。亚基因组优势建立过程中染色质水平发生了哪些变化?最近的工作揭示了染色质修饰的亚基因组特异性差异。然而,染色质模式的变化在新形成的种间杂交和异源多倍体仍然知之甚少。最后,每个亚基因组的染色体在细胞核中是如何组织的?先前对四倍体棉花的研究提供了迄今为止最好的证据,表明每个亚基因组可能保持在细胞核的独立部分。在多倍体化后的早期阶段,需要进一步研究细胞核内每个亚基因组的组织,以及对其他异源多倍体的互补研究。
结论 Conclusions
亚基因组优势可能是由于亚基因组间邻近基因甲基化TE丰度的差异和/或作为一种结果,以解决将多个不同的二倍体祖物种合并到一个单一细胞核所产生的遗传冲突。虽然相对较低的甲基化TE密度与显性亚基因组相关,但尚不清楚如果细胞核内存在遗传不亲和性,哪个亚基因组成为优势亚基因组。在某些情况下,如果甲基化TE丰度差异在亚基因组中也存在,这可能决定哪个亚基因组成为优势。先前的研究表明,优势亚基因组显著降低了基因附近甲基化TE丰度。然而,如上所述,亚基因组显性也可能受到环境的影响。因此,虽然甲基化TE丰度似乎是亚基因组优势的一个很好的预测因子,但尚不清楚新形成的杂种和异源多倍体中所预测的劣势亚基因组是否能在特定环境中被选择为优势表达。这对从生态学研究到作物育种工作的研究领域具有重大意义,因为对任一亚基因组的基因表达偏倚将影响种间杂交和异源多倍体中观察到的表型性状的变异性。最后,未来的研究需要继续深入研究亚基因组优势的潜在机制,包括遗传和表观遗传,在各种物种、组织和环境中。