分享一篇發(fā)表在Nature Methods上的文章,標(biāo)題為“Predicting glycan structure from tandem mass spectrometry via deep learning”,文章的通訊作者是來自哥德堡大學(xué)的Daniel Bojar教授,其課題組致力于聚糖方面的研究。
聚糖修飾是最為豐富的翻譯后修飾,然而確定聚糖的結(jié)構(gòu)卻充滿挑戰(zhàn)性。同一分子質(zhì)量可能對應(yīng)不同拓?fù)浣Y(jié)構(gòu)的聚糖。因此在傳統(tǒng)的鑒定流程下,研究人員通常需要分離結(jié)構(gòu)異構(gòu)體,隨后使用MS將其碎裂成更小的亞結(jié)構(gòu)加以鑒定。這種流程費時費力,難以大規(guī)模進(jìn)行。本文,作者利用大規(guī)模的串聯(lián)譜圖數(shù)據(jù)集,基于深度學(xué)習(xí)算法建立了CandyCrunch模型,并實現(xiàn)了90%的聚糖結(jié)構(gòu)預(yù)測準(zhǔn)確性。
作者從超過2000個糖組學(xué)實驗中收集得到近50萬張帶有聚糖注釋的LC-MS/MS譜圖,聚糖類型涵蓋了主要的真核生物聚糖修飾類型。作者引入卷積神經(jīng)網(wǎng)絡(luò)以學(xué)習(xí)MS/MS中的碎裂模式和強度比。它以MS/MS譜圖、保留時間、母離子m/z和一些其它實驗參數(shù)作為輸入,以聚糖的預(yù)測排名作為輸出(包含聚糖的質(zhì)量和拓?fù)浣Y(jié)構(gòu))。為方便使用,作者建立了工作管道以支持原始文件作為輸入(如.mzML文件)。
在評估過程中,CandyCrunch能夠達(dá)到超過90%的拓?fù)浣Y(jié)構(gòu)預(yù)測準(zhǔn)確性,并在各種聚糖類型中表現(xiàn)相當(dāng)。聚類結(jié)果表明,模型對聚糖對的預(yù)測表示暗示了它們之間的結(jié)構(gòu)相似性。需要指出的是,CandyCrunch本身是一個多分類模型,因此對應(yīng)零樣本預(yù)測(預(yù)測訓(xùn)練數(shù)據(jù)集中不存在的聚糖結(jié)構(gòu))是不可行的。最后,作者借助CandyCrunch開發(fā)得到CandyCrumbs用以指認(rèn)不同離子峰對應(yīng)的聚糖亞結(jié)構(gòu)。
本文作者:ZF
責(zé)任編輯:FTY
文章鏈接:https://doi.org/10.1038/s41592-024-02314-6
原文引用:DOI:?10.1038/s41592-024-02314-6