基于16S rDNA測序評估種水平和菌株水平的微生物組分析(IF-11.878)
使用計算機模擬和高通量測序實驗評估16S rDNA測序在物種和菌株水平上分類的能力。研究結果證明,全長16S測序較短讀長的16S測序,有更高的物種分辨率;同時,全長16S測序可以準確的檢測SNP。該研究顯示,全長16S rDNA測序可以鑒定到“種”和“菌株”水平。
材料和方法
-
從Greengenes數據庫下載全長16S rRNA非冗余基因集,計算機模擬不同可變區。
-
36種細菌構建模擬微生物群落,使用PacBio CCS模式進行全長16S測序。
-
4個健康人的糞便樣品,分別使用PacBio CCS模式進行全長16S測序、Illumina對V1-V3區測序和宏基因組測序。
-
人類腸道微生物分離物,使用PacBio CCS模式進行全長16S測序。
研究結果
全長16S rDNA測序分類分辨率更好
全長16S rDNA長度約1500bp,包含9個可變區。對全長16S rRNA非冗余基因集序列中包含的PCR引物結合位點剪切后,產生不同可變區的模擬擴增子。
結果發現,不同可變區的物種分類結果存在很大差異。其中V4區表現最差,56%未匹配到物種;V1-V2區對蛋白菌門的鑒定表現不佳;而V3-V5區對放線菌門的鑒定表現不佳;V1-V9區結果最好;當使用全長序列時,幾乎所有的模擬擴增子可以匹配到物種。不同亞區的選擇顯著影響聚類產生OUT的數量,序列相似度達到99%時,所有可變區都未能重現原始數據庫中不同序列的數量。
模擬擴增子研究表明,使用短序列對不同亞區進行測序,無法區分相似度高的類群。
16S rDNA拷貝數變異反映菌株水平變異
使用36種細菌模擬群體實驗,對混合樣品進行PacBio CCS模式測序。將測序獲得的全長16S序列比對到數據庫。發現同一物種內不同16S基因拷貝數之間存在差異,因此不同16S基因拷貝數可以作為鑒別菌株的工具。
復雜微生物組內的16S多態性
選擇4個健康人的糞便樣品,分別使用全長16S測序、Illumina對V1-V3區測序、同時使用短序列對宏基因組進行測序和分析。結果顯示,全長16S和V1-V3區在Bacteroides屬的相對豐度相似,但是V1-V3區不能檢測到Bacteroides indestinalis。通過對Bacteroides vulgatus分析全長16S rDNA不同拷貝之間的變異檢測,顯示測序數據中同一個OUT存在堿基替換現象,而且替換特征與已測序的菌株各不相同。表明全長16S rDNA可以分辨非常相近的細菌分類。
基因組內16S多態性普遍存在
通過對人類腸道微生物分離物進行全長16S測序,發現這些基因普遍存在多態性;而且,通過比較相同OTU內的SNP特征,發現3種細菌分離株之間存在不同的SNPs頻率(圖4b-d)。研究表明相似物種之間在基因組內16S基因拷貝變異的差異,可用于分辨相同物種內的菌株。
參考文獻
Johnson, J.S., Spakowicz, D.J., Hong, B. et al. Evaluation of 16S rRNA gene sequencing for species and strain-level microbiome analysis. Nat Commun 10, 5029 (2019).