細菌耐藥已成為影響全人類健康的重大問題,引起了全世界廣泛的關注。世界衛(wèi)生組織提出的解決耐藥措施之一是研發(fā)耐藥快速準確的新型診斷技術和相關試劑。傳統(tǒng)的檢測方法基于細菌培養(yǎng),周期長,易導致漏診、誤診,延誤治療時機。而基于基因的檢測技術,如具有靈敏、高效、快捷特點的基因芯片、數(shù)字 PCR等技術,是公認的快速檢測技術。然而,到目前為止,由于耐藥基因型與表型結果的不一致,使得基因檢測只能作為培養(yǎng)法的輔助手段用于耐藥的檢測?! ?/p>
中國科學院微生物研究所馮婕研究組等針對肺炎鏈球菌β-內酰胺耐藥這一重要臨床問題,采用機器學習的方法挖掘耐藥相關數(shù)據(jù)的規(guī)律,建立了基因型和表型之間的聯(lián)系,使得基因檢測不再是一個輔助手段,而有望成為一種主要的耐藥快速檢測技術。
肺炎鏈球菌β-內酰胺耐藥的主要機制是三種青霉素結合蛋白(PBP1a,PBP2b和PBP2x)的轉肽酶結構域(TPD)的改變。由于不同臨床肺炎鏈球菌分離株PBPs的高度變異性,以及鏈球菌間重組導致的嵌合結構,使得PBPs極具多樣化,導致了很難將PBPs的突變與臨床耐藥性聯(lián)系起來。馮婕組研究人員首先將NCBI數(shù)據(jù)庫已公布的PBPs序列通過類別方差法計算,得到了139個與耐藥高度相關的HVLs (highly variant amino acid)。再以4300株肺炎鏈球菌的轉肽酶結構域(TPD)序列以及對應頭孢呋辛、阿莫西林的耐藥表型作為數(shù)據(jù)庫,將其中80%的數(shù)據(jù)作為訓練集,20%的數(shù)據(jù)作為檢驗集,用HVLs去預測頭孢呋辛和阿莫西林的耐藥水平,結果發(fā)現(xiàn)與用PBPs蛋白的TPD序列預測效果一樣好。進一步分析發(fā)現(xiàn),HVLs與PBPs的某些區(qū)域的序列有很強的相關性。因此,分別使用來自pbp2x (2253 bp)的750 bp片段和來自pbp2b (2058 bp)的750 bp片段可以很好地預測頭孢呋辛和阿莫西林的耐藥性。這種長度只需要一個Sanger測序反應即可,不僅使檢測操作更加簡單,也降低了成本。此外,通過對人工構建的突變體和來自更多臨床分離的菌株的耐藥表型的檢測,進一步確認了機器學習法能精確預測耐藥表型。應用該預測方法,研究人員分析了NCBI數(shù)據(jù)庫中已測序的8138株肺炎鏈球菌,進而建立了耐藥表型、血清型以及ST型之間的關聯(lián),促進了對肺炎鏈球菌的流行病學的認識?! ?/p>
該研究成果在線發(fā)表于Briefings in Bioinformatics雜志,馮婕與南方科技大學教授楊亮為共同通訊作者。該研究得到國家自然科學基金和北京市科學技術委員會的資助。
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com