全球有大約有180萬種已經被命名的真核生物(具有細胞核結構的生物,壹般較為高等),2018年11月啟動的地球生物基因組計劃(Earth BioGenome Project, EBP)旨在對所有的這些已知的真核生物進行基因組測序,以基因組數據和基因組學研究促進全球生物多樣性的保護和利用。
這個雄偉的計劃由加州大學戴維斯分校基因組學家哈瑞斯·萊文等人和華大集團的基因組學家楊煥明、徐訊、張國捷等聯合倡議啟動。 EBP的前兩年(即2018-2020年)為項目的啟動階段,從2020年底項目第壹階段開始,過去的壹年是項目的起步之年,也是取得重要進展的壹年。
近日,《美國科學院院刊》( PNAS )發布了EBP特別專輯,其中收錄了兩篇華大參與的文章, 重點回顧了EBP項目在起步之年取得的重大進展和未來面臨的挑戰,以及綠色植物基因組研究的現狀 。
PNAS 官網截圖
對於項目的前兩年而言,核心任務是推動國際合作,吸納更多團隊和合作方加入,同時,制訂壹系列的標準和規範,各方在約定的規範下,有計劃地完成更多的基因組測序工作。
為此, EBP項目完善了整體的組織和管理,建立了包括樣本收集和憑證中心、基因組技術中心、附屬專項中心等國際交流組織,並制定了多項標準規範, 內容涉及項目參與、數據分享、知識產權獲取及分享等,並以此來促進項目參與者的多元化、公平性、包容性、正義性。
在制訂項目合作框架的基礎上,目前43個EBP附屬項目,涵蓋了大多數主要的真核生物類群,對博物館藏品和野外生物學家提供的數萬個高質量樣本進行了存取。成員機構和附屬項目的地理多樣性,則涵蓋了除南極洲外,其余所有大陸的21個國家。作為非洲生物基因組計劃的壹部分,第壹批非洲生物多樣性基因組項目在2021年上線。 未來,EBP還計劃將成員機構和附屬項目進壹步擴展到世界其他生物多樣性地區,包括印度次大陸、東南亞和南美洲。 EBP的最終成功,需要在發展中國家建立科學能力。
在啟動階段,基因組測序工作已經有條不紊地開展起來,完成了對1,719個真核生物物種的基因組測序。所有這些物種的基因組組合,都存放在公***的數據庫中。其中,有316個達到了“參考基因組”水平,即符合EBP制訂的“參考基因組”標準。
這些基因組代表了分類學上200多個不同的非冗余的科。在此之外,還有3,021個科級別的參考基因組在2021年完成。因此, 到2021年底,即項目的第壹個完整年度,大約有3,200個科級分類至少有壹個參考基因組被采樣,這相當於完成了項目第壹階段目標的34% 。
隨著項目的推進,其他具有互補性目標的大規模倡議也加入了項目中,成為附屬項目,包括BIOSCAN和全球病毒組計劃(Global Virome Project)等。BIOSCAN的目標是獲取地球上的每壹個真核生物物種的DNA標簽(DNA barcode),這對EBP的樣本可靠性驗證和獲取稀有樣本進行測序至關重要。與全球病毒組計劃的合作,則創造了壹個令人興奮的途徑,以確定與其宿主物種相關的潛在致病病毒,並為生物監測戰略的開發提供了可能。 這些項目之間的高度協調,將對生物多樣性研究和 社會 成果產生協同效應。
然而, 項目在取得重大進展的同時,也面臨著極大的挑戰。其中,最大的挑戰在於難以獲得樣本。 雖然大約50%分類學上科級別的樣本,可以從全球基因組多樣性網絡(Global Genome Biopersity Network)的現有樣本中獲得,但是從許多國家獲得樣本可能需要不同的許可程序,少則持續數周,多則持續數年。此外,還有更多的樣本需要重新采集,這也帶來了樣本鑒定、保存和運輸等方面的巨大挑戰。
與此同時,在獲得樣本的基礎上,對如此眾多的物種進行測序,其工作量也是巨大的。按照項目計劃,第壹階段,每年必須生產近3,000個基因組,即在3年內完成大約壹萬個基因組測序,這同樣給樣本采集、運輸、測序,以及後續的數據分析,帶來了極大的挑戰。
此外,完成項目所需的經費也是巨大的,當前的組織方式是讓更多的附屬項目自行籌措經費,後續進壹步協助各個附屬項目申請經費,並獲得更多項目整體執行的經費,這都將是重要的挑戰。
鑒於地球生物多樣性的不穩定狀況,地球生物基因組計劃及其附屬項目必須實現其宏偉的目標。用大衛·艾登堡的話說:“ 滅絕即永恒,我們必須馬上行動。 ”(Extinction is forever—so our action must be immediate.)
每個真核生物物種都是數百萬年進化的產物。它們的基因組中記錄的秘密,可以從根本上改變我們對地球上生命進化的理解—它的存在和本質—並可能帶來全新的方法,以 減輕氣候變化對生物多樣性的影響,改善農業,發展可持續的全球生物經濟,拯救物種和修復生態系統,以及預防未來的大流行病 。地球生物基因組項目的開展,意義重大。