2021年7月15日,由福建農(nóng)林大學(xué)、中國農(nóng)業(yè)科學(xué)院(深圳)農(nóng)業(yè)基因組研究所等多家單位共同合作在國際頂級(jí)期刊Nature Genetics上發(fā)表“Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis”的文章,該研究利用自主開發(fā)的新算法破譯了高雜合鐵觀音的基因組組裝難題,并在此基礎(chǔ)上闡釋了等位特異性表達(dá)應(yīng)對(duì)”遺傳負(fù)荷”的機(jī)制及茶樹群體進(jìn)化和馴化歷史,為茶樹育種改良提供了新見解。安諾優(yōu)達(dá)為本次研究提供二代和PacBio三代建庫測(cè)序服務(wù)。
文章名稱:Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis
發(fā)表時(shí)間:2021年7月15日
發(fā)表雜志:Nature Genetics
研究物種:茶樹(Camellia sinensis)
影響因子:38.330
研究背景
茶葉作為一種全球性的經(jīng)濟(jì)作物,有很強(qiáng)的保健作用。茶樹是無性繁殖的,這種方式可以有效地維持因有性重組而分離或丟失的有價(jià)值的基因型。然而,這種繁殖方式也會(huì)積累大量有害突變,導(dǎo)致“穆勒棘輪”效應(yīng),致使作物遭受損失。茶樹是二倍體,含有15對(duì)同源染色體,嵌合式的基因組組裝(篩選同源染色體中的一份拷貝作為代表組裝到染色體水平)可能會(huì)錯(cuò)過重要選擇性狀的等位變異,而分型組裝(不同親本的兩套同源染色體同時(shí)組裝到染色體水平)能更完整地呈現(xiàn)二倍體基因組的全部遺傳信息。本文通過對(duì)中國烏龍茶品種鐵觀音及幾個(gè)主要的茶樹品種和近緣物種進(jìn)行測(cè)序及單體型組裝,探索地理上不同的茶樹群體之間的遺傳多樣性,為深入了解茶樹的馴化史和進(jìn)化史提供依據(jù)。
樣本選擇
山茶植株芽、根、莖、花、幼葉和成熟葉
測(cè)序策略
DNA:
PacBio Sequel II平臺(tái)基因組測(cè)序 114X
Illumina NovaSeq 150 bp雙端測(cè)序,DNA小片段文庫
Illumina NovaSeq,Hi-C文庫 99.4X
RNA:
PacBio Sequel II平臺(tái),Iso-Seq文庫
研究思路
研究結(jié)果
1.基因組組裝與注釋
鐵觀音的基因組大小約為3.15 Gb,雜合度為2.31%。利用PacBio長讀長對(duì)原始數(shù)據(jù)進(jìn)行組裝得到初始contig,大小為5.41 Gb。將Khaper算法過濾產(chǎn)生的單倍體組裝結(jié)果掛載到15個(gè)染色體(圖1),得到單倍體參考基因組(monoploid reference genome),大小為3.03 Gb。同時(shí)利用ALLHiC算法得到鐵觀音單體型基因組(haplotype-resolved genome),大小為5.98 Gb。共線性分析顯示它們的基因順序高度一致。
圖1鐵觀音基因組組裝和質(zhì)量評(píng)估
(a)單倍體參考基因組circos圖,呈現(xiàn)15條染色體特征;(b)Hi-C熱圖呈現(xiàn)15條染色體組裝質(zhì)量;(c)LAI(LTR Assembly Index)評(píng)估鐵觀音基因組和已發(fā)表茶樹基因組組裝質(zhì)量;(d)鐵觀音單倍體參考基因組和單體型基因組的共線性比較
2.等位基因特異性表達(dá)
利用鐵觀音不同組織的全基因組測(cè)序,分離得到14,691個(gè)等位基因(圖2),其中1,528個(gè)基因存在一致性的等位特異性表達(dá)(consistent allele-specific expression, ASEGs),即一個(gè)等位基因在所有組織和樣本中的表達(dá)都高于另一等位基因。基因富集分析顯示這些基因參與核糖體等多個(gè)生物學(xué)基本過程,與克服有害突變的潛在機(jī)制相關(guān)。同時(shí)還發(fā)現(xiàn)了386個(gè)非一致的ASEGs,它們?cè)诓煌M織的等位基因之間存在特異性表達(dá)。其中幾個(gè)基因與揮發(fā)性有機(jī)化合物的生物合成有關(guān),包括黃酮和黃酮醇等的生物合成途徑,這與植物的適應(yīng)性演化相關(guān)。結(jié)果表明,在鐵觀音基因組中,一致性的ASEG明顯多于不一致的ASEG(1,528 vs 386),這一趨勢(shì)與雜交水稻的結(jié)果正好相反,即在雜交水稻中,不一致的ASEG遠(yuǎn)遠(yuǎn)大于一致性的ASEG。這種現(xiàn)象或許可以用雜種優(yōu)勢(shì)理論中的顯性效應(yīng)解釋,長期無性繁殖的茶樹利用優(yōu)勢(shì)等位基因應(yīng)答不斷積累的遺傳負(fù)荷,以保持個(gè)體的適應(yīng)度。
圖2 茶樹單倍型基因組等位不平衡
(a) 兩個(gè)單倍型序列的比對(duì)(10 Mb非重疊的窗口);(b)等位基因CDS序列比較;(c)等位基因的選擇壓力分析;(d)等位基因的非同義替換位點(diǎn)數(shù)目分布;(e)等位特異性表達(dá)基因(ASEGs)在茶樹葉片中的表達(dá)情況;(f)舉例說明一致性的ASEGs(CsSRC2);(g)舉例說明非一致的ASEGs(CsGGPS1)
3.茶樹遺傳變異和群體結(jié)構(gòu)分析
通過對(duì)161份茶樹種質(zhì)資源重測(cè)序數(shù)據(jù)分析,發(fā)現(xiàn)樣本主要分為三類(圖3),分別為大理茶,大葉茶和小葉茶,與茶樹的形態(tài)學(xué)分類一致。另外大葉茶可以分類古大葉茶和栽培大葉茶;而小葉茶依據(jù)地理分布可分為四個(gè)亞組,分別為SSJ(陜西,四川,江西),ZJNFJ(浙江和福建北部),SFJ(福建南部),HHA(湖北,湖南和安徽)。TreeMix分析發(fā)現(xiàn)這些茶樹之間存在顯著的基因流動(dòng),表明種內(nèi)基因交流頻繁,其中一些與有記錄的茶樹雜交育種歷史相吻合。
圖3茶樹群體系統(tǒng)進(jìn)化與群體結(jié)構(gòu)分析
(a)重測(cè)序樣本的地理分布;(b)群體系統(tǒng)發(fā)育樹;(c)PCA主成分分析;(d)群體遺傳結(jié)構(gòu)分析(k=7)
4.大葉茶和小葉茶的進(jìn)化史和馴化史
對(duì)14種山茶屬植物的21株單株進(jìn)行了全基因組測(cè)序,通過群體遺傳分析發(fā)現(xiàn)大葉茶和小葉茶具有不同的進(jìn)化史。在Gelasian epoch時(shí)期(259-181萬年前),劇烈的氣候變化很可能導(dǎo)致了整個(gè)茶樹物種(包括大葉茶和小葉茶)的群體收縮;兩個(gè)變種分化后,僅小葉茶在Last Glacial Maximum時(shí)期(2.65-1.9萬年前)可能由于溫度驟降出現(xiàn)了再一次的群體收縮,但隨后適應(yīng)了環(huán)境的小葉茶迅速擴(kuò)張,群體規(guī)模得到恢復(fù)。該分析表明,大葉茶和小葉茶分化后的進(jìn)化史不同(圖4)。通過對(duì)大葉茶和小葉茶馴化基因的分析,發(fā)現(xiàn)它們的馴化過程是并行的(即獨(dú)立馴化),這些馴化基因參與了一系列重要的生物學(xué)過程且受人工選育的偏好性影響。基于KEGG分析,在大葉茶馴化早期以參與氧化石墨烯苷轉(zhuǎn)運(yùn)、糖苷轉(zhuǎn)運(yùn)通路為主,后期品種改良主要集中在合成生物堿和芳香化合物等。例如,研究人員鑒定到CsXDH基因在大葉茶品種改良階段受到強(qiáng)烈的人工選擇,該基因編碼黃嘌呤脫氫酶,是咖啡因合成通路的重要基因。而小葉茶品種的早期馴化與植物抵御相關(guān),改良過程主要集中在花發(fā)育的調(diào)控和對(duì)一氧化氮的響應(yīng),已有研究表明,NO的積累可以加速γ-氨基丁酸的消耗從而幫助植物抵御冷脅迫,這表明篩選耐寒的品種也是人工選育的重要目標(biāo)。
圖4大葉茶和小葉茶的平行馴化
(a)平行馴化模式圖;(b)全基因組的選擇性清除信號(hào);(c-f)重要基因的人工選擇信號(hào)(XDH,CM,F(xiàn)3’H,BAS1,DWF4);(g)人工選擇基因的表達(dá)情況
小結(jié)
本研究成功組裝了兩套鐵觀音基因組(單倍體參考基因組和單體型基因組)。通過對(duì)等位基因特異性表達(dá)的分析,預(yù)測(cè)顯性效應(yīng)可能是鐵觀音應(yīng)對(duì)遺傳負(fù)荷的重要機(jī)制。通過對(duì)茶樹種群水平的遺傳分析,揭示了該物種的進(jìn)化和人工馴化歷史。該成果為利用組學(xué)分析和分子生物學(xué)技術(shù)挖掘功能基因、解析其背后的遺傳調(diào)控機(jī)制,開展基于大數(shù)據(jù)驅(qū)動(dòng)的基因組智能設(shè)計(jì)育種奠定了堅(jiān)實(shí)的理論基礎(chǔ),同時(shí)也為縮短育種周期、提高育種效率、降低育種成本提供了科學(xué)依據(jù)。
作為國內(nèi)基因組行業(yè)知名企業(yè),安諾基因擁有實(shí)力強(qiáng)大的測(cè)序服務(wù)平臺(tái),配備系列先進(jìn)儀器設(shè)備,三代PacBio(1臺(tái)Sequel IIe+7臺(tái)Sequel II+10臺(tái)Sequel)為您的科研之路保駕護(hù)航;專業(yè)的生物信息分析團(tuán)隊(duì),豐富的項(xiàng)目分析經(jīng)驗(yàn),讓您的數(shù)據(jù)分析之途無憂。安諾基因已與中國農(nóng)業(yè)大學(xué)、中科院遺傳與發(fā)育所、中國海洋大學(xué)、中國農(nóng)業(yè)科學(xué)院、福建農(nóng)林大學(xué)等多家科研院所開展了深度合作,助力基因組文章發(fā)表于Nature、Nature Plants、Nature Communications、Molecular Plant、Communications Biology、The Plant Journal等多個(gè)國際高水平期刊。
參考文獻(xiàn):
Zhang X, Chen S, Shi L, et al. Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis [published online ahead of print, 2021 Jul 15].Nat Genet. 2021;10.1038/s41588-021-00895-y.
免責(zé)聲明:市場有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
標(biāo)簽: