當前位置: 華文世界 > 科學

這棵15cm高的「巨無霸」,低調到科學家今年才註意到……

2024-06-27科學

說起「巨無霸」,你最先想到的是什麽?

是漢堡中的銷量王者?【變形金剛】中力大無比的機器人?還是世界上體型最大的生物,比如重達180噸的藍鯨和高達115米的北美紅杉?

今天要講的這位,雖然外表平平無奇,卻在近日成為 真核生物界新晉的基因組「巨無霸」,它就是來自梅溪蕨屬( Tmesipteris )的 T. oblanceolata (為方便閱讀,下文簡稱其為「梅溪蕨」,種加詞oblanceolata指「倒披針形的」)

這一稱號實至名歸,因為梅溪蕨的基因組大小達到了驚人的160.45 Gb! 它同時打破了三項世界紀錄——「最大的蕨類植物基因組」、「最大的植物基因組」和「最大的基因組」。 此前,後兩項紀錄一直由基因組大小為148.89 Gb的日本重樓( Paris japonica )自2010年起保持著。

「160.45 Gb」是個什麽概念呢?

這還得從什麽是基因組,基因組的大小及其如何衡量說起。

新一屆「巨無霸」T. oblanceolata植株 (圖片來源:Fernández et al., 2024)

上一屆「巨無霸」日本重樓植株 (圖片來源:PPBC-吳寶成;Alpsake/Wikimedia Commons)

形容基因組有多「大」?不論斤也不論兩

基因組有兩個層面的含義:在物種水平上 ,基因組指某一物種所有個體極度相似但略有差異的遺傳資訊;而 在個體水平上 ,基因組指存在於某一個生物體內所有細胞中的遺傳物質的總和,包括DNA或RNA(部份病毒)。

在生命的宏偉詩篇中,DNA是那神秘的編織者,用四種基礎的字母——腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)和鳥嘌呤(G)編織出無盡的遺傳密碼。正如多米諾骨牌一般,每一塊骨牌的倒下都引發連鎖反應,這些堿基的排列組合,決定了生物的多樣性,讓每一個生命體都擁有其獨特的遺傳藍圖。

那麽,我們如何衡量遺傳資訊有「多少」呢?

一般來說,衡量一個生物的遺傳資訊有三種方式:

(1)以重量計算的C值,單位通常是皮克(10-12克,pg);

(2)以分子量計算,單位為道爾頓;

(3)以核苷酸堿基(ATCGU)對的數量表示。

以核苷酸堿基對的數量來表示是衡量基因組大小最常用的方法。

和電腦儲存容量單位類似,我們將一個堿基對的「容量」定為1 bp(base pair),如果將堿基對連線起來,一千個為1 Kb,一百萬個為1 Mb,十億個則為1 Gb。但與電腦儲存容量不同的是,電腦儲存大小的進率是1024,而基因組大小的進率是1000。

那麽如何測定一個物種的基因組大小呢?目前,我們可以透過 流式細胞術、 K -mer分析法和基因組從頭測序 的方法來估算,這三種方法在評估基因組大小的精確度上依次提高,但相應的,它們的技術難度、準確度和成本也隨之增加。

隨著三代測序技術的迅猛發展,基因組測序的成本已經顯著降低,如今完成一個1 Gb基因組的深度測序、組裝及註釋的價格已經降至10萬元內了。然而,即便成本大幅下降,對於160 Gb的梅溪蕨基因組這樣龐大的專案,其高昂的費用仍然只有少數財力雄厚的「土豪」團隊能夠承擔。

再者,三代測序組裝基因組前一般會用流式細胞術或 K -mer法對基因組大小進行「摸底」。於是,在這項研究中,科研人員首先安排上了較為「經濟實惠」的流式細胞術估算梅溪蕨基因組大小。

流式細胞術的原理是透過制備細胞核懸浮液,對核酸進行熒光染色,並使用已知基因組大小的物種作為參考,根據兩個物種間相對熒光密度(DNA含量)峰值的橫座標,對基因組大小進行等比例計算。

如下圖所示, 梅溪蕨和基因組大小為148.89 Gb的日本重樓的峰值橫座標的比值為1.12(226.60/202.28),說明梅溪蕨的基因組大小約為日本重樓的1.12倍! 這項研究同時使用了洋蔥、貝母屬 Fritillaria lusitanica 和日本重樓作為內參,最終估算的梅溪蕨基因組大小為160.45 ±0.81 Gb。

梅溪蕨與日本重樓的流式細胞結果 (圖片來源:Fernández et al., 2024)

大大的基因組,卻有小小的身體?

盡管梅溪蕨擁有「巨型」基因組,但其植株看起來卻相當迷你且不起眼。

梅溪蕨屬是松葉蕨科(Psilotaceae)下的一個小屬,包含15個種,其中12種都具有附生內容。

本文的主角 T. oblanceolata 梅溪蕨比較罕見,它在西南太平洋的新喀裏多尼亞島及一些鄰近島嶼上被發現,株高最多15 cm。梅溪蕨屬不僅植株迷你,也是科學家眼中很小眾的類群,到目前為止,該屬中只報道了兩個物種的基因組大小,即四倍體 T. tannensis (73.19 Gb)和八倍體 T. obliqua (147.29 Gb),這兩者都擁有巨型基因組。

本研究通訊作者Jaume Pellicer教授在調查附生梅溪蕨的生境 (圖片來源:Oriane Hidalgo)

來自邱園的植物學家Ilia J. Leitch教授是這項研究的參與者之一,她用了一個形象的比喻來描述梅溪蕨的基因組大得有多誇張—— 如果把其細胞內纏繞折疊的DNA像抽絲一樣展開,長度可超過100米,相比之下,人類基因組大約為3.1 Gb,展開後每個細胞中的DNA長度僅為2米左右!如果按照字母和漢字的大小比例,將兩對堿基算一個字節,梅溪蕨的基因組可以寫下11萬本【紅樓夢】(73.1萬字/本),相當於一個圖書館的藏書量了!

那麽,基因組大小和生物體大小之間是否有某種關聯?對一個物種來說,基因組越大越好嗎?

其實,著名的「 C值悖論 」已經回答了第一個問題,該理論提出物種的基因組大小(C值)和它前進演化的復雜性之間是沒有嚴格的對應關系的,基因組大小和生物體大小就更沒有關系啦。

而且與人們設想的不同, 擁有更大的基因組通常並不是一種優勢 。這是因為,基因組越大,合成的DNA就越多,需要的能量和營養物質也越多,同時,在每次細胞分裂時復制基因組的能量需求也越高。

以植物為例,擁有大量DNA的通常都是那些生長緩慢的多年生植物,它們的光合作用效率較低,並且需要更多的營養物質才能生長,繁殖和產生後代更緩慢,適應環境也可能更緩慢。

Ilia J. Leitch教授認為,想要管理好如此龐大的遺傳資訊,就像 「試圖在擁有數百萬本書的圖書館中,找到幾本有關如何在如此龐大的DNA中生存的指導書」 一樣荒謬,畢竟基因組中,僅有很小一部份的DNA由編碼蛋白質的基因組成。

那麽,擁有如此龐大基因組的梅溪蕨是如何存活下來的呢?它又是如何管理基因組中復雜的遺傳資訊的呢?

我們首先要搞明白梅溪蕨如此龐大的基因組從何而來。

想要讓基因組「瘋狂擴張」,有兩種方法可以實作

植物的基因組大小具有驚人的差異性,目前已知基因組最小的植物是貍藻科的一種食蟲植物——旋刺草( Genlisea aurea ),它的基因組大小只有0.0636 Gb,因為梅溪蕨的加入,使得植物基因組大小的變化範圍擴充套件到了驚人的2500倍(160.45/0.0636)。

目前的研究認為,基因組大小的變化主要由兩類因素驅動。

1. 基因組多倍化

指某物種透過染色體倍增的方式導致多套染色體共存於同一細胞核中,形成穩定遺傳的新物種的現象。這就類似於多倍體同時點了好幾份基因組的「豪華套餐」,例如稻屬中,基因組分別為400 Mb和600 Mb左右的二倍體斑點野生稻和藥用野生稻雜交並多倍化後,產生了異源四倍體小粒野生稻,其基因組達到1Gb。

2. 重復序列的擴張

基因組中重復出現的DNA序列叫做重復序列,例如轉座子(一類能夠在染色體上自主復制和位移的DNA序列)。由於大多數轉座子不具備基因編碼能力,因此曾被叫做「垃圾序列」。然而,隨著科學的發展和研究的深入,科學家也發現,重復序列不僅是大型植物基因組的重要組成部份,也是基因組前進演化的重要驅動因素。

以寄生生物為例,一般來說,它們為了減少自身負荷和能耗,會盡可能讓基因組精簡,但寄生花卻擁有3.5 Gb的大型基因組,其中就有高達90%的序列由高度重復的轉座子組成。盡管它的基因組看起來十分「巨無霸」,但事實上大部份基因的結構都非常簡單,且基因遺失數量極高,是名副其實的「虛胖型選手」。

雖然梅溪蕨的基因組還未被解析,細胞學數據也暫未被收集到,我們暫不清楚蕨類植物是如何應對如此不必要的巨型基因組帶來的後果的。但是, 科學家們猜測,梅溪蕨的基因組「巨無霸」套餐是這樣客製的:多倍體身份or「虛胖」的冗余序列?它才不做選擇,全都要了!

3.多倍體身份

相較於被子植物,蕨類植物的細胞中通常擁有較高的染色體數目,這種現象也被稱為「染色體囤積症候群」,梅溪蕨屬的單套染色體組中的染色體基數就達到了x = 52。此外,現有證據發現梅溪蕨屬內不乏四倍體、八倍體等,這簡直buff疊滿了呀!

4.高度的序列

研究者們推測,梅溪蕨屬多個物種的巨型基因組可能與其「附生」的內容有關,或許與擁有「寄生」內容的寄生花相似,其基因組中也存在高度冗余的重復序列。

此外,根據以往大型基因組的研究案例,我們也可以大膽推測: 梅溪蕨基因組中或許存在一些高度擴張的基因家族,對其適應環境有著重要作用 ;梅溪蕨基因組中或許也發生了大量的基因遺失事件, 只有少量控制關鍵性狀的基因得以保留,這些基因或許是梅溪蕨成功管理其巨型基因組的關鍵 ;梅溪蕨現有群體如此小,是否曾經歷了瓶頸效應,使其遺傳多樣性降低,積累了大量有害突變,這個物種未來是否會面臨生存的危機,是否需要采取保護措施......當然,這一切問題的答案,還是坐等「土豪」團隊解析完基因組後,由前進演化生物學家來揭曉吧。

還有哪些基因組「巨無霸」?

除了本文的主角,自然界中其實還擁有不少基因組大小超過100 Gb的生物,比如植物中的梅溪蕨屬、日本重樓、延齡草屬、白果槲寄生,動物中的各種肺魚和泥螈。雖然這些生物中,有的能跑能跳能劃水,有的紮根土壤吸收日月精華;有的顏值極高,有的其貌不揚;有的「身強力壯」,有的弱不禁風......但它們都有一個共同的名字——基因組「巨無霸」!

已知基因組大小超過100 Gb的生物 (圖片中文化自:Fernández et al., 2024)

會不會有一種生物的基因組比梅溪蕨還要大?一切皆有可能!或許,下次你在山澗野外,在城市公園偶遇到的一株不起眼小草,可能就是一個隱藏的基因組「巨無霸」。

參考文獻:

[1] Fernández et al., A 160 Gbp fork fern genome shatters size record for eukaryotes. iScience, 2024,109889.

[2] Cai et al., Deeply Altered Genome Architecture in the Endoparasitic Flowering Plant Sapria himalayana Griff. (Rafflesiaceae). Current Biology, 2020, 31: 1-10.

[3] Unlocking the Genetic Giant: Tiny Fern Has the Largest Genome of Any Organism on Earth. Kew Science, 2024.

[4] Schupak A. Largest known genome is within this plain plant on the forest floor, study says. CNN, 2024.

[5] Leushkin et al., The miniature genome of a carnivorous plant Genlisea aurea contains a low number of genes and short non-coding sequences. BMC Genomics, 2013, 14: 176.

作者:王新

作者單位:中國科學院植物研究所

稽核:李鹍鵬 中國科學院植物研究所