您好,歡迎光臨武漢貝納科技服務有限公司
027-62435310 | service@benagen.com | 中文 | English 咨詢客服
您現在的位置:主頁 > 市場與支持 > 文獻解讀 >

使用Nanopore宏基因組測序識別并驗證細菌基因組變異

由于重序列,使用Illumina測序很少獲得完整的宏基因組組裝基因組(MAGs)。本研究基于Nanopore測序和新開發的分析流程組裝獲得13個環狀MAGs,所有MAGs完整率均大于98%,冗余度小于3%。且開發的流程可以用于驗證組裝結果的準確性,進一步提高宏基因組的組裝質量。

研究背景

雖然Illumina測序對宏基因組組裝基因組(MAGs)進行組裝和分箱,可以提高不可培養微生物群落的基因組解析程度。然而,由于重復區域難以組裝,使得基于短reads的宏基因組組裝很少獲得完整的基因組序列。本研究提出的使用短讀長和超長讀長(N50>25kb)混合組裝的策略,完成并驗證了來自細菌群落的多個完整的MAGs,包括最近提出的 Candidate Phyla Radiation基因組;開發的流程使研究人員能夠驗證來自宏基因組組裝的基因組,通過進一步分析提高宏基因組的組裝質量。

研究思路


材料和方法

材料:2012年從北部艾伯塔省油砂尾礦池中富集的藻類細菌培養物。

測序:分別使用MinION和Illumina測序,MinION測一張芯片。

分析:長reads用metaFlye組裝成環狀MAGs,進而使用Rebaler和Pilon軟件分別使用長reads和短reads進行糾錯。

 

結果

基因組組裝

組裝和驗證工作流程如圖1所示。使用優化的高分子量DNA提取方法,經過測序獲得的reads N50為24kb,使用metaFlye初步組裝獲得13個環狀MAGs。將長reads比對回組裝結果上,經過進一步過濾后,形成“pseudo-isolate”reads簇。發現一個獨特的reads簇,其reads長度與比對得分比為1-2,含有許多嵌合reads(圖2)。


 

圖1 組裝和驗證工作流程

 

圖2 Algoriphagus alkaliphilus reads長度與比對評分的關系

 

用ANVI‘o v6.0計算每個基因組的完整率和冗余度,除 Candidate Phyla Radiation (CPR)基因組外,所有基因組的完整率均大于98%,冗余度小于3%。CPR基因組完整率較低,與之前的報道一致。
 

表1 使用anvi-estimate-genome-taxonomy對環狀基因組進行了分類預測


 

檢測高覆蓋率基因組的變異

在兩個覆蓋率最高的基因組Parvibaculum和brevundimonas中,均含一段過濾后的Nanopore reads覆蓋率下降,而未過濾的Nanopore和Illumina reads覆蓋率一致的區域。經過進一步比對分析,有一簇過濾后的reads支持這一組裝結果,而大多數情況下,reads簇在一個堿基上停止。推測基因組變異可能是造成這種情況的原因,這得到了大多數長reads的支持。對于Parvibaculum基因組,參考基因組有35kb的缺失,少數reads支持這一結果,但大多數reads支持35kb的插入。準確mapped上的超長reads支持這兩種結果,表明確實存在35kb缺失的次要變異,和35kb區域插入的主要變異(圖3)。使用Prokka進行注釋,缺失的區域包含一個鎳和鈷抗性蛋白cnrA、一個銅抗性蛋白copB和一個3型IS家族轉座酶,表明最近發生了一次基因水平轉移事件,可能造成該物種功能損失或增加。
 

 

圖3  Parvibaculum sp002480495 基因組的可視化

 

UBA1547 SP002422915基因組的變異

UBA1547基因組被鑒定為 Candidate Phyla Radiation基因組。有一段約30kb區域,Illumina和Nanopore reads覆蓋率下降1.4倍,GC含量急劇增加(從51%增加到63-68%)。雖然像這種重大變化通常可能是宏基因組的組裝錯誤或污染所致,但發現相鄰區域有overlap的長reads 覆蓋到,且有4個超長reads跨越整個區域,也有超長reads(至少15kb)與兩側的交界點重疊(圖4)。該區域注釋為IV型分泌物、重組酶和I型內切酶。
 

圖4 UBA1547 SP002422915基因組異常區域的深入分析

 

為確保每個基因組都能正確組裝,對每個基因組繪制覆蓋度、GC skew和GC含量的可視化圖。觀察到超過1kb,約63.77%的Nanopore reads,唯一比對上64.38%的Illumina reads,可以組裝成一個基因組。只要Nanopore reads跨越整個重復區域或與兩個相鄰區域有overlap,則認為該區域是正確組裝。

 

這些基因組真的完成了嗎?

使用長讀長或混合組裝對每個基因組的“Psuedo-isolate” reads重新組裝,以確定其他組裝算法是否與初始宏基因組組裝一致。大多數“Psuedo-isolate” reads使用Flye成功地重新組裝成單個基因組(表2)。對Illumina數據組裝的 Spades 軟件效果不佳,hybrid軟件的混合組裝在許多覆蓋率很低的基因組獲得多個contigs。值得注意的是,最近對長讀長組裝的標準測試表明,Flye可以成功組裝約10X覆蓋率的基因組,并且可能比其他算法更擅長組裝低覆蓋率的基因組。
 

表2 對“Psuedo-isolate” reads重新組裝的結果

 

總結

本研究提出的使用短讀長和超長讀長(N50>25kb)混合組裝的策略,完成并驗證了來自細菌群落的多個完整的MAGs,包括最近提出的 Candidate Phyla Radiation基因組。本研究開發的流程將使研究人員能夠驗證來自宏基因組組裝的基因組,通過進一步分析提高宏基因組的組裝質量。

 

 

Copyright ? 2018 武漢貝納科技服務有限公司 . All Rights Reserved. Designed by 鄂ICP備13016520號-1技術支持:中網維優
亚洲2020天天堂在线观看_欧美男人的天堂_日本无吗免费_二区_精品丝袜国产自在线拍