当前位置: 华文世界 > 科学

全基因组转录组分析揭示了参与毛豆种子硬度的关键调控网络和基因

2024-07-26科学

编译:微科盟 月亮鱼,编辑:微科盟 景行、江舜尧。

微科盟原创微文,欢迎转发转载,转载请注明来源于【转录组】公众号。

导读

种子硬度是毛豆的重要品质性状。 为了确定影响种子硬度的因素,研究者从中国26个省份的216份大豆材料中选择了两种种子硬度差异较大的地方品种牛毛黄(低)和邳县四粒糙(高) 研究者测定了毛豆种子中水分、可溶性糖、淀粉、蛋白质和油脂等主要成分的含量,并对种子发育的五个阶段进行了转录组分析 转录组分析表明,在种子发育中后期,大量参与淀粉、贮藏蛋白和脂肪酸合成或降解的基因差异表达,导致牛毛黄和邳县四粒糙种子成熟过程中贮藏物质积累的差异。 种子发育中后期的细胞增殖活性和细胞壁形成也可能在一定程度上影响种子的硬度。此外, 研究者采用加权基因共表达网络分析(WGCNA)鉴定了调控种子硬度的共表达基因模块和枢纽基因 过表达候选种子硬度调控枢纽基因 GmSWEET2 导致种子硬度增加 本研究验证了 GmSWEET2 在调节毛豆种子硬度中的重要作用 并确定了许多调控种子硬度和种子成分比例的潜在关键调节因子 ,为改善毛豆的口感奠定了基础。

论文ID

原名: Genome-wide transcriptome analysis reveals key regulatory networks and genes involved in the determination of seed hardness in vegetable soybean

译名: 全基因组转录组分析揭示了参与毛豆种子硬度的关键调控网络和基因

期刊: Horticulture Research

IF: 7.6

发表时间: 2024年4月

通讯作者: 邢邯,郭娜,赵晋铭

通讯作者单位: 南京农业大学农学院

DOI号: 10.1093/hr/uhae084

实验设计

结果

1 216份大豆材料种子硬度评价

为了筛选满足不同地区消费者偏好的不同种子硬度的毛豆品种,研究者在R6阶段对中国26个省份的216个品种和地方品种的种子硬度进行了为期3年的测量。研究者用织构分析仪探针在穿刺过程中测量的机械功(W)来评价种子的硬度 ;2014年、2015年和2016年的W (g.mm)分别为581.3~1835.2、615.8~1647.0、549.0~1123.8(图S1和表S1)。结果表明, 不同大豆品种在R6期种子硬度存在明显差异。3年表型平均值显示,46份种子硬度高(W>1000 g.mm), 36份种子硬度低(W<800 g.mm) ;其余为中等种子硬度(800 g.mm<W<1000 g.mm)。

图1.不同时期NMH和PXS种子硬度及组分含量。 (A, B) NMH和PXS不同发育阶段(S1-S5)的豆荚和种子。(C) NMH和PXS在不同阶段的种子硬度(以穿刺时测量的机械功表示)。数据以mean±SD表示(n=8个生物重复)。* P <0.05, ** P <0.01,Student’s t-test.。(D-H) S1-S5阶段NMH和PXS中水、可溶性糖、淀粉、蛋白质和油的含量。数据以mean±SD表示(n=3个生物重复)。n,无显著差异。* P <0.05,** P <0.01, Student’s t-test。

2 两个地方毛豆品种种子硬度相关物质成分的积累与籽粒硬度的对比

研究者从216份大豆材料中选择在多种环境下R6期种子硬度差异稳定的两个地方品种,即:低种子硬度的牛毛黄和高种子硬度的邳县四粒糙,分别简称为:NMH和PXS。研究者将种子发育分为S1-S5阶段,其中S1-S3阶段为始粒期后期(R5), S4阶段为鼓粒期(R6),S5阶段为成熟期的初期(R7,图1A和B) 。在S1和S2阶段,子叶正处于贮藏产物灌浆阶段,但水分占种子重量的80%以上(图1D),因此NMH和PXS在这两个阶段具有相同的柔软质地。 NMH和PXS之间种子硬度的显著差异首先出现在S3期,并在S4期变得更加显著 (图1C)。 为了评估种子硬度与种子成分积累之间的关系,研究人员测量了毛豆种子中主要成分的含量,包括水、可溶性糖、淀粉、蛋白质和油(图1D-H)。随着种子发育,NMH和PXS的含水量均呈下降趋势,在后3个阶段,NMH的含水量显著高于PXS NMH和PXS的可溶性糖含量均先上升后下降,在S3期达到峰值,然后下降,在S4和S5期基本趋于平稳 。在S2期,NMH的可溶性糖含量显著高于PXS,而在S5期则相反。与可溶性糖相似, 淀粉含量也呈现先升高后降低的趋势,在S3或S4期达到峰值,在S5期显著降低 。在S3和S4期,NMH淀粉含量显著高于PXS。在S4期之前,含油量随着种子的发育逐渐增加。 2个品种在S3期和S4期的含油量差异显著 蛋白质含量表现出先降低后增加的趋势,在S4期达到最低,在S5期出现回升 ,这与前期对大豆种子发育过程中蛋白质含量变化的研究一致。后两个阶段,NMH的蛋白质含量显著低于PXS。

3 两个地方毛豆品种种子硬度差异的RNA-Seq分析

为了进一步研究不同地方品种种子发育差异的分子基础,研究人员使用RNA-Seq技术生成转录组基因表达图谱。在S1~S5期,研究者对NMH和PXS的大豆种子进行3个生物重复的取样 。本研究共构建了30个文库,获得247.34 Gb的clean read。在不同的样本中,Q30百分比超过90.85%,超过94.03%的clean reads被唯一比对到大豆基因组(表S2)。 研究者在NMH的S1、S2、S3、S4和S5期分别共鉴定出32716个、31360个、29000个、28450个和27726个转录本 。此外, 在所有五个阶段均表达了23872个转录本 (图2C)。同样的, 研究者在PXS的S1、S2、S3、S4和S5期分别共鉴定出32475、30988、29372、28677和29100个转录本,在所有阶段共表达25965个转录本 (图2D)。 总的来说,随着种子的发育,各阶段表达的基因数量逐渐减少。 研究者将所有表达的基因基于FPKM分为三个表达水平。在不同的样本中,至少60%的表达基因呈现低表达(0.5≤FPKM≤5)水平。约28.0%~37.5%和1.3%~2.0%的表达基因分别表现为中等(5≤FPKM≤100)和高(FPKM≥100)表达水平(图S2)。

为了研究从转录组测序中获得的大量信息,研究人员对30个样本的所有表达基因进行了主成分分析(PCA) (图2)。从不同发育阶段来看,NMH的S1、S2和S3阶段聚集在一起,说明NMH在这三个发育阶段的总体转录组基因表达谱相似。同样,PXS的S2、S3和S4阶段聚集在一起,表明它们的转录组基因表达谱高度相似。 从不同品种的角度看,在S1和S5阶段,NMH与PXS呈高度相关。相反,NMH和PXS在S2、S3和S4阶段表现出明显差异,提示S2、S3和S4可能是导致表型差异的关键阶段 。接下来, 研究人员根据30个组织样本中所有表达基因的平均FPKM值进行了分层聚类和Spearman相关系数分析 ,如图2B所示,与PCA结果基本一致。有趣的是,在NMH和PXS中,S2和S3样本的总体转录组基因表达谱非常相似,相关系数分别为0.96和0.97。NMH的S2和S3期与S1期的相关性更强,而PXS的S2和S3期则倾向于种子发育的后期(S4)期。结果表明, 与NMH相比,PXS在种子发育的早期和中期表现出更快的发育。

研究者对每个发育阶段的7个基因进行qRT-PCR分析,以验证RNA-seq数据的质量。 qRT-PCR获得的测试基因的表达模式与RNA-seq数据中观察到的表达模式高度相似(图S3),表明转录组和qRT-PCR分析之间的一致性。

图2. 种子发育过程中基因表达谱分析。 (A) NMH和PXS种子发育五个阶段RNA-Seq数据的主成分分析。(B) RNA-seq数据的Spearman相关系数分析。(C和D) (C) NMH和(D) PXS五个阶段检测到的转录本的维恩图。

4 种子发育过程中差异表达基因的鉴定

研究人员对NMH和PXS在各发育阶段的差异表达基因(DEGs)进行了两两比较。差异表达分析显示,NMH与PXS之间在S1期有1519个基因、在S2期有4302个基因、在S3期有4553个基因、在S4期有2308个基因、在S5期有2663个基因存在差异表达 (|log2 (fold change)|≥1,FDR<0.05,图3A)。 两两比较分析确定了各品种五个发育阶段的DEGs 。不同发育阶段的DEGs数量如图3B所示。有趣的是, 研究者在PXS的S1期和S2期两两比较分析中发现,有3393个基因显著差异表达,而在NMH中有175个 。相反, PXS的S3期和S4期鉴定出468个DEGs,而NMH的S3期和S4期鉴定出6171个DEGs 。大量的DEGs具有较强的代谢活性,加速了种子的发育进程。与其他相邻阶段相比,NMH和PXS在阶段S2和S3之间鉴定出的DEGs较少。这些结果与PCA和相关分析结果一致,即: PXS在种子发育中前期的发育进程要快于NMH,且S2期和S3期的总体转录组基因表达谱高度一致。考虑到S2期和S3期的整体转录组基因表达谱具有较高的一致性,并且考虑到2个品种在S2期的种子硬度和种子成分含量几乎没有显著的表型差异,研究人员在后续的研究中重点研究了S3期和S4期。

5 决定种子发育和种子硬度的基因差异表达

为了探究NMH和PXS在S3和S4阶段(推测是决定种子硬度的关键阶段)鉴定出的DEGs的功能,研究者进行了GO富集分析 ,显著富集到多个GO条目(FDR<0.05)。图3C和图D分别显示了S3和S4阶段中最显著的前20个GO条目。值得注意的是,在S3阶段,「谷氨酰胺代谢过程」(GO:0006541)、「植物外膜发育」(GO:0080060)、「植物型细胞壁组织」(GO:0009664)和「转运蛋白活性」(GO:0005478)显著富集。「核小体」(GO:0000786)、「核小体组装」(GO:0006334)、「核小体DNA结合」(GO:0031492)和「细胞增殖」(GO:0010456)等GO条目在S4期显著富集,大部分相关基因在PXS中下调(图S4),表明细胞有丝分裂和DNA复制在NMH S4期仍然相当活跃,这可能会减缓种子中储存物质(如油和储存蛋白)的积累,导致种子硬度降低。

研究者通过KEGG通路富集分析还发现了S3和S4阶段的DEGs中显著富集的代谢和信号转导通路。 从S3和S4阶段鉴定出的最重要的20个KEGG途径如图3E和f所示。「转运体」(KO02000)、「甘油脂代谢」(KO00561)、「亚油酸代谢」(KO00591)、「糖酵解/糖异生」(KO00010)、「精氨酸和脯氨酸代谢」(KO00330)、「苯丙类生物合成」(KO00940)、「淀粉和蔗糖代谢」(KO00500)和「丙氨酸、天冬氨酸和谷氨酸代谢」(KO00250)在S3阶段显著富集。「外泌体」(KO04147)、「亚油酸代谢」(KO00591)、「染色体及相关蛋白」(KO03036)、「糖酵解/糖异生」(KO00010)、「氮代谢」(KO00910)、「脂肪酸降解」(KO00071)和「赖氨酸降解」(KO00310)在S4阶段富集。

研究发现,在S3和S4阶段,显著富集到一些影响种子硬度的合成和代谢途径。研究人员分析了参与淀粉合成、淀粉降解、脂肪酸合成、储存蛋白合成、木质素合成和DNA复制的关键基因的表达模式(图S4) 在S4期,PXS中大部分淀粉合成酶基因的表达量低于NMH 。在S3期和S4期(尤其是S3期),PXS中参与淀粉降解的大多数基因包括编码α-淀粉酶、β-淀粉酶和磷酸化酶的表达均上调。 与NMH相比,编码种子贮藏蛋白的基因在PXS的S4和S5期表现出更高的转录活性。 其中编码β-甘氨酸的2个基因 Glyma.20G146200 Glyma.20G148200 在PXS中的S1到S5阶段上调幅度超过6倍。 在S4和S5阶段,大部分与脂肪酸合成和延伸有关的 ,如编码丙酮酸脱氢酶、乙酰辅酶a羧化酶和乙酰基载体蛋白等蛋白质的基因在PXS中表达上调。PXS中编码苯丙烷代谢和木质素合成相关蛋白的大部分基因,如CAD、4CL、HCT和CCoAOMT的表达量较高,尤其是在S3和S5期。在S2和S3阶段,PXS中大多数与DNA复制和细胞增殖有关的基因的转录水平高于NMH,而S4阶段则相反。

图3. PXS和NMH在不同样品中的差异表达基因。 (A) NMH和PXS在每个发育阶段之间的DEGs数。(B) NMH(右上部分)和PXS(左下部分)各发育阶段的DEGs数量。按FPKM >5, FDR<0.05,|log2(fold change)|≥1筛选DEGs。红色或蓝色的数字分别表示行对应的样本与列对应的样本相比,上调或下调的基因数量。(C)和(D) S3 (C)和S4 (D)显著性最高的前20个GO条目。(E)和(F) S3 (E)和S4 (F)显著性最高的前20个KEGG通路。

6 加权基因共表达网络构建及枢纽基因鉴定

研究者利用WGCNA对种子发育过程中的基因调控网络进行了研究。 筛选低表达基因(FPKM<0.5)后, WGCNA保留31459个基因 研究者根据这些基因的共表达模式,构建了基因聚类树状图,并鉴定出27个不同的模块(用不同的颜色标记) (图4)。然后, 研究者基于模块特征值分析各个模块在不同样本中的表达模式 (图4B)。 2个品种在S3或S4期有7个模块的表达模式相反 (图4D;图S5A)。 antiquewhite1、darkolivegreen4、firebrick2和deepppink模块中的基因在NMH中高表达,而在S3或S4阶段的PXS中表达水平较低。misyrose和skyblue2模块的基因在PXS中高表达,而在NMH中低表达 。此外, coral3模块具有品种特异性,仅在一个品种中高表达 研究人员构建了这7个模块的基因共表达网络图谱 (图4C;图S5B-G),其中每个网络中心的基因为该模块的枢纽基因。表S3列出了属于每个模块的所有枢纽基因。

为了明确这7个模块在大豆种子发育中的作用,研究人员进行了KEGG富集分析;从每个模块中识别出的最显著的10个KEGG通路 如图S6所示。 通过KEGG富集分析,研究人员发现这7个模块可能在不同方面发挥作用,共同调节大豆主要贮藏物质含量和种子硬度 deeppink, mistyrose,darkolivegreen4,和coral3模块显示出与蛋白质加工相关的KEGG通路的富集 ,如「内质网蛋白质加工」(KO04141)和「蛋白质加工」(KO99975)。 firebrick2模块富集「脂肪酸延伸」(KO00062)、「脂质生物合成蛋白」(KO01004)和「丙酮酸代谢」(KO00620) 。因此, 研究人员推测该模块主要参与大豆种子含油量的调节。Skyblue2模块参与淀粉和蔗糖代谢以及细胞壁合成 。淀粉和蔗糖代谢(KO00500)和苯丙素生物合成(KO00940)显著富集在这个模块。该模块鉴定了编码细胞壁合成相关蛋白的基因,如咖啡酸3-O-甲基转移酶,纤维素合酶A催化亚基2 (CesA2)和shikimate O-羟基肉桂酰基转移酶(HCT)。 值得注意的是,antiquewhite1模块在大豆发育的S4阶段大量涉及淀粉、蛋白质和脂肪酸的合成和积累。 antiquewhite1模块包括45个基因,其中包括「丙酮酸代谢」(KO00620)、「糖酵解/糖异生」(KO00010)、「碳水化合物代谢」(KO09101)、「淀粉和蔗糖代谢」(KO00500)、「苯丙氨酸、酪氨酸和色氨酸生物合成」(KO00400)和「柠檬酸循环(TCA循环)」(KO00020)。1个糖外排转运蛋白(SWEET)编码基因( Glyma.03G209600 )和1个硝酸盐转运蛋白1/肽转运蛋白家族(NPF)基因( Glyma.14G047200 )被确定为该模块的候选枢纽基因。此外,该模块还检测到可溶性淀粉合成酶( Glyma.06G129400 )、丙酮酸激酶( Glyma.19G000700 )和果胶酯酶( Glyma.17G044700 )的编码基因。

图4. NMH和PXS表达基因的WGCNA。 (A)显示WGCNA识别的共表达模块的聚类树状图。树上的每一片叶子(短垂直线)代表一个基因。这些分支对应于高度关联的基因模块。树状图下方的颜色行表示根据聚类结果对模块进行划分,并根据分层聚类对27个模块进行合并。(B)基于Pearson相关系数的模块-样本关系。每一行对应一个用不同颜色表示的模块。每一列对应一个NMH或PXS不同阶段的样本。(C) antiquewhite1模块基因共表达网络图谱。节点大小表示基因连通性,节点颜色表示基因类别。候选枢纽基因位于每个模块的中心。(D)热图显示了antiquewhite1模块中所有共表达基因的表达模式。直方图显示了不同样本中表达的模块特征基因的变化。

7 GmSWEET2提高了R6期毛豆种子硬度

1个糖外排转运蛋白(SWEET)基因Glyma.03G209600被鉴定为antiquewhite1模块的枢纽基因。在之前对大豆SWEET基因家族的研究中, Glyma.03G209600 被命名为 GmSWEET2 ,它被认为是AtSWEET9的同源物,并在质膜上运输蔗糖。 研究人员比较了来自NMH和PXS的GmSWEET2的编码DNA序列(CDS) 。如图S7A所示, GmSWEET2 在NMH和PXS中的CDS是一致的。因此, 研究人员推测NMH和PXS之间种子硬度的差异可能是由GmSWEET2表达量的差异引起的 。研究者通过qRT-PCR验证了 GmSWEET2 的组织表达模式(图5A)。GmSWEET2几乎只在花、豆荚和S4期种子等汇器官中表达,表明 GmSWEET2 在汇器官中卸载蔗糖,特别是在种子发育后期蔗糖从母体组织转运到种子中发挥了重要作用。在S4期,与PXS相比,它在NMH种子中的表达量更高。

为了评估 GmSWEET2 在大豆种子硬度测定中的作用,研究人员在邳县四粒糙(PXS)遗传背景下培育了 GmSWEET2 -过表达转基因品系( GmSWEET2 -OE) (图5B)。R6期转基因植株与野生植株的种子大小无显著差异(图S9)。然而, 与野生型(WT)植物相比, GmSWEET2 过表达导致R6期种子硬度显著降低 (图5C)。 为了进一步了解 GmSWEET2 诱导大豆种子硬度变化的机制,研究人员在R6期测定了野生型和 GmSWEET2 -OE品系的主要种子成分含量,包括淀粉、可溶性糖、油、蛋白质和水分含量 (图5D-H)。 与野生型相比,GmSWEET2-OE植株的淀粉、可溶性糖、油脂和水分含量显著增加,蛋白质含量显著降低,这使得过表达植株在R6期的种子硬度较低。为了揭示GmSWEET2蛋白的亚细胞定位,研究人员将 GmSWEET2 与GFP融合在烟草叶片中表达 。如图5I所示, GmSWEET2 -GFP融合蛋白定位在质膜上。

图5. GmSWEET2改变了R6阶段种子的硬度和成分含量。 (A) GmSWEET2 的组织特异性表达。采用qRT-PCR检测 GmSWEET2 在大豆茎、叶、根、花、豆荚和种子中不同发育阶段的相对表达量。(B) GmSWEET2 在WT (PXS)和 GmSWEET2 -OE系中的相对表达量。数据以mean±SD表示(n=3个生物重复)。* P <0.05, ** P <0.01,与WT比较,Student’s t-test。(C) WT (PXS)和 GmSWEET2 -OE系在R6阶段的种子硬度。箱形图显示中位数(水平线)和个体值(黑点)(n=8个生物重复)。* P <0.05, ** P <0.01,与WT比较,Student’s t-test。(D-H) R6期WT (PXS)和 GmSWEET2 -OE系淀粉、可溶性糖、油脂、蛋白质和水分含量;数据以mean±SD表示[(D)和(E) n=6,(F)到(H) n=3]。n,无显著差异。* P <0.05,** P <0.01,Student’s t-test。(I)35S::GmSWEET2-GFP表达融合蛋白在烟叶细胞中的荧光成像。Bars=20 μm。

讨论

1 蛋白质和淀粉含量是决定毛豆硬度的关键因素

种子硬度是毛豆食用品质的主要指标之一。坚硬的质地通常会降低消费者对毛豆的接受度。因此,了解毛豆种子硬度的分子调控机制对提高毛豆的食用品质具有重要意义。 本研究从216份大豆材料中筛选出两个毛豆地方品种NMH(稳定的低种子硬度)和PXS(稳定的高种子硬度) NMH与PXS的硬度差异在代表R5(始粒期)期后期的S3期显著,在S4期(对应大豆生殖生理阶段的R6(鼓粒期)期,也是毛豆的收获期)达到最大值。 作为种子的一种物理性质,硬度在很大程度上受种子化学成分的影响。可溶性糖,如蔗糖、葡萄糖和果糖有助于蔬菜大豆的甜味。以往对不同毛豆品种感官评价的研究表明,毛豆的咀嚼度与甜度呈负相关。然而, 在本研究中,2个品种在S4期的可溶性糖含量没有显著差异 。在水稻、玉米和鹰嘴豆的研究中也发现,种子硬度与蛋白质含量呈正相关,与淀粉含量负相关。 在S4期,与NMH相比,PXS的蛋白质含量较高,淀粉含量较低 。以往对小麦的研究发现,小麦籽粒的硬度似乎是由胚乳蛋白质基质和淀粉颗粒的物理结构决定的。硬质小麦有足够的蛋白质形成连续的蛋白质基质来物理包裹淀粉粒,而软质小麦不能形成连续的蛋白质基质来包裹淀粉粒,导致更软、更开放的籽粒结构。 研究者对R6期毛豆种子微观结构的观察也发现,高硬度品种的种子蛋白质网状结构更紧密,而低硬度品种的种子蛋白质含量更低,蛋白质结构更松散。蛋白质/淀粉比的降低导致种子结构更加开放,更多的水分填充淀粉粒与蛋白质基质之间的空隙,进一步降低了种子的硬度。在S3和S4期,高种子硬度地方品种PXS的含油量显著高于低种子硬度地方品种NMH 。然而,一些研究表明成熟大豆的种子硬度与含油量呈显著负相关,而对毛豆的研究表明含油量与种子硬度无显著相关。毛豆种子的含油量与硬度之间的关系还有待进一步研究证实。

2 转录组分析揭示了毛豆种子硬度调控的关键途径

与种子硬度表型相似,NMH和PXS之间的蛋白质、淀粉、油和水分含量在S3和S4期表现出显著差异。 因此, 研究人员推测S3期和S4期是决定毛豆种子硬度的关键时期。PCA和DEG分析显示,S1期PXS和S1、S2、S3期NMH的转录组基因表达谱比较相似,而S2、S3、S4期PXS和S4期NMH的基因表达谱比较相似,说明NMH在种子发育中前期比PXS发育缓慢 。鹰嘴豆和玉米的研究表明,早期快速发育可能与较小的颗粒大小有关,而大豆的种子大小与种子硬度呈负相关。

KEGG通路分析显示,S3期NMH和PXS的DEGs在「精氨酸和脯氨酸代谢」和「丙氨酸、天冬氨酸和谷氨酸代谢」等氨基酸代谢相关通路中显著富集 。氨基酸是蛋白质的基本成分。有趣的是, 这些途径的代谢物,如天冬酰胺、谷氨酰胺和精氨酸,是蛋白质积累高峰阶段(R5和R6阶段)氨基酸浓度最高的 。作为灌浆期大豆氮素的重要来源,天冬酰胺和谷氨酰胺含量与籽粒蛋白质含量呈正相关。此外, 「糖酵解/糖异生」在S3和S4阶段的DEGs中都显著富集,并且NMH中该途径所含基因的表达水平高于PXS 。以往的研究发现,玉米和鹰嘴豆有丝分裂活性的延长伴随着较高的糖异生。当种子获得足够的糖供应时,不会发生糖异生;然而,在大豆种子发育后期,随着母体营养供给的减少,丙酮酸和甘油作为原料通过糖异生步骤不断积累碳水化合物。因此, 研究人员观察到,从S4期到S5期,由于母体营养供应的减少和糖异生的消耗,种子中油脂的积累速率显著降低。然而,淀粉和可溶性糖含量没有增加,这可能是由于淀粉在种子发育后期被降解为可溶性糖,然后转化为脂肪酸、磷酸甘油和氨基酸, 这在其他物种中已经得到证实。 S3期DEGs中「苯丙烷生物合成」相关基因显著富集,且PXS中大部分编码苯丙烷代谢和木质素合成关键酶的基因如4CL、C4H和HCT的表达量较高 。苯丙烷代谢途径是植物重要的次生代谢途径之一,木质素是苯丙烷代谢的重要代谢物。早期的研究表明,木质素可以提高豆科作物如大豆和鹰嘴豆的种皮强度。 「淀粉和蔗糖代谢」在第S3期显著增加。此外,与NMH相比,研究人员发现大多数淀粉降解基因在S3期的PXS中表现出较高的转录活性,而编码淀粉合成酶的基因在S4期的PXS中表现出较低的转录活性。这就解释了为什么在S3期和S4期PXS的淀粉含量高于NMH。与脂肪酸合成和延伸有关的基因以及编码储存蛋白的基因在S4和S5期的PXS中表现出较高的转录活性,这与S4和S5期PXS中较高的蛋白质和油脂含量是一致的。

3 GmSWEET2在调节毛豆种子硬度中起重要作用

作为系统生物学的一个强大工具,在许多作物中,WGCNA已被用于识别关键遗传网络。 在本研究中,研究人员发现NMH和PXS在S3或S4阶段有7个模块表现出相反的表达模式。通过对这7个模块的KEGG通路富集分析,研究人员发现antiquewhite1模块主要与蛋白质、淀粉、脂肪酸等成分的代谢和积累有关。

antiquewhite1模块在NMH的S4期高表达。 该模块的枢纽基因为糖最终出口转运蛋白编码基因 GmSWEET2 和硝酸盐转运蛋白/肽转运蛋白家族(NPF)编码基因 GmNPF6.4 。蔗糖是通过韧皮部向发育中的种子输送碳能量的主要来源。它依靠蔗糖载体和蔗糖外排转运体来实现有效的运输和分配。糖被认为在糖转运到种子中起着重要作用,从而影响种子的发育和化学成分。 GmSWEET2 位于已报道的种子蛋白含量QTL中。NPF转运体广泛参与植物对氮的吸收利用过程,在提高作物氮素利用效率和产量方面发挥着重要作用。此前对水稻和玉米的研究表明,NPF转运体影响籽粒发育和淀粉、蛋白质等贮藏物质的含量。

在本研究中, GmSWEET2 过表达导致R6期种子中淀粉、可溶性糖和油脂含量增加,蛋白质含量降低。 GmSWEET2 定位于质膜,在R6期种子中高表达,介导蔗糖向发育中的种子卸载。 在植物的贮藏器官中,淀粉合成的原料主要来自于叶片中合成的蔗糖,通过韧皮部远距离运输到贮藏器官。同时,蔗糖也是乙酰辅酶a的主要来源,乙酰辅酶a是脂质生物合成的前体。 GmSWEET2 表达水平升高时,会伴随更多的蔗糖从母体组织转移到发育中的种子中,导致种子中淀粉和油脂积累更多。 此外,蛋白质合成依赖于碳和氮的可用性。随着SWEET糖转运体活性的增加,氮的有效性可能成为一个限制因素,更多的糖酵解中间体转向脂肪酸合成途径,从而降低相对蛋白质含量。 蛋白质/淀粉比的降低导致种子无法形成更紧密的蛋白质网状结构来包裹淀粉颗粒,导致种子结构更柔软、更开放,从而降低了种子硬度。在本项研究中,研究人员还使用了CRISPR/Cas9敲除牛毛黄的 GmSWEET2 基因(NMH),获得了两个纯合子 GmSWEET2 敲除系( GmSWEET2 -KO,图S8A和B) 。然而, GmSWEET2 -KO植株与野生型植株在R6期的种子硬度没有显著差异 (图S10),这可能是因为SWEET家族含有许多协同工作的基因,具有一定的冗余性,导致在敲除 GmSWEET2 后,SWEET家族的其他基因在一定程度上替代了 GmSWEET2 的作用。 虽然 GmSWEET2 的表达水平在NMH和PXS之间存在显著差异,但GmSWEET2的启动子序列在两个地方品种中是一致的(图S7B),这可能是由于NMH和PXS之间结合启动子并调节GmSWEET2表达的转录因子存在差异。根据PlantPAN3.0的预测,905个转录因子有可能与 GmSWEET 2启动子结合,其中35个转录因子在PXS和NMH中有差异表达,包括ERF、NAC、WRKY、bHLH等转录因子家族 (表S5)。这些转录因子在毛豆种子硬度调控中的具体作用有待进一步研究。

综上所述, GmSWEET2 糖转运蛋白通过提高淀粉含量和降低蛋白质含量来降低R6期大豆种子的硬度。 本研究的综合转录组数据的分析为毛豆品质性状的研究提供了有用的基因组资源,并为大豆种子发育的分子网络提供了新的见解。