
上海有機(jī)所交叉中心發(fā)表四維代謝組學(xué)精準(zhǔn)分析技術(shù)Met4DX
中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所生物與化學(xué)交叉研究中心朱正江研究員課題組在Nature Communications雜志在線發(fā)表了題為 “A mass spectrum-oriented computational method for ion mobility-resolved untargeted metabolomics” 的研究論文(Nature Communications, 2023, 14: 1813)。該工作針對(duì)基于離子淌度質(zhì)譜的四維代謝組學(xué)技術(shù)開(kāi)發(fā)了一種端到端的精準(zhǔn)數(shù)據(jù)分析技術(shù)Met4DX,用于四維代謝組學(xué)數(shù)據(jù)的四維峰檢測(cè)、峰對(duì)齊和峰定量,并結(jié)合四維數(shù)據(jù)庫(kù)實(shí)現(xiàn)代謝物的四維精準(zhǔn)匹配和鑒定(圖1)。朱正江課題組博士研究生羅名都同學(xué)是論文的第一作者,中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所生物與化學(xué)交叉研究中心為第一單位。
離子淌度質(zhì)譜相較于傳統(tǒng)質(zhì)譜增加了根據(jù)離子尺寸、形狀以及電荷分離的離子淌度,有效提升了質(zhì)譜的分離能力,特別是代謝物同分異構(gòu)體的分辨能力,其跟液相色譜聯(lián)用形成多維分離分析技術(shù),能進(jìn)一步提高復(fù)雜生物樣本分析的分離度和峰容量。一次四維代謝組學(xué)分析能夠同時(shí)對(duì)代謝物離子進(jìn)行四個(gè)維度的表征,包括精確質(zhì)量數(shù)(MS1)、二級(jí)質(zhì)譜圖(MS/MS)、色譜保留時(shí)間(RT)和離子淌度碰撞截面積(CCS),能有效提升對(duì)復(fù)雜生物樣品中代謝物定性和定量分析的覆蓋度和準(zhǔn)確度。然而,四維代謝組數(shù)據(jù)的高度復(fù)雜性對(duì)數(shù)據(jù)的高效精準(zhǔn)分析提出了巨大的挑戰(zhàn),尤其是四維質(zhì)譜峰的檢測(cè)仍然是難點(diǎn)。因此,四維代謝組數(shù)據(jù)分析技術(shù)和工具相對(duì)有限。目前少量工具,如 MS-DIAL與MZmine等,均采用了自上而下壓縮數(shù)據(jù)的降維策略進(jìn)行峰檢測(cè)。該降維策略可以降低數(shù)據(jù)的維數(shù)和復(fù)雜性,但降維過(guò)程也不可避免低引入了信號(hào)掩蔽以及干擾,顯著降低了四維峰檢測(cè)的靈敏度。

圖1. 四維代謝組學(xué)精準(zhǔn)數(shù)據(jù)分析技術(shù)Met4DX
液相色譜–離子淌度–質(zhì)譜依次從液相、離子淌度以及質(zhì)譜維度對(duì)代謝物實(shí)現(xiàn)多維分離,所需要的時(shí)間也逐級(jí)減小。受到該分離方式的啟發(fā),本文開(kāi)發(fā)了從一張質(zhì)譜圖出發(fā)的自下而上峰組裝算法(mass spectrum oriented bottom-up assembly algorithm)用于四維代謝組學(xué)數(shù)據(jù)中四維峰的檢測(cè)(圖2)。該技術(shù)的特點(diǎn)是將每一張質(zhì)譜圖作為四維數(shù)據(jù)中的最小數(shù)據(jù)單元,采用逆向工程的策略依次構(gòu)建其在離子淌度和液相色譜上的峰形。具體地,對(duì)于每一張質(zhì)譜圖,該算法會(huì)依次進(jìn)行其前體離子的搜索、離子淌度流出峰的組裝與檢測(cè)、離子淌度流出峰的拓展、色譜流出峰的組裝與檢測(cè)和四維峰積分等五個(gè)步驟實(shí)現(xiàn)四維代謝峰檢測(cè)與峰定量。本文開(kāi)發(fā)的自下而上的峰組裝算法避免了數(shù)據(jù)壓縮與降維,有效地提高了四維峰檢測(cè)的覆蓋度與靈敏度。以上述算法為核心,本文進(jìn)一步開(kāi)發(fā)了適用于四維代謝組學(xué)的端到端的精準(zhǔn)數(shù)據(jù)分析技術(shù)Met4DX,通過(guò)二級(jí)譜圖去冗余模塊、自下而上的峰組裝模塊、四維峰對(duì)齊以及分組模塊、代謝物的多維匹配與鑒定模塊等實(shí)現(xiàn)了的四維復(fù)雜代謝組的精準(zhǔn)定性和精確定量分析。

圖2. 自下而上的峰組裝算法和Met4DX數(shù)據(jù)分析流程(圖片修改自Nature Communications)
Met4DX技術(shù)能夠?qū)崿F(xiàn)高覆蓋的四維質(zhì)譜峰檢測(cè),定量精密度高。與同類技術(shù)相比(如MS-DIAL 和MetaboScape),Met4DX能夠提升四維峰檢測(cè)的覆蓋度2-3倍,提升準(zhǔn)確定量代謝物的數(shù)目2-5倍。Met4DX在代謝物同分異構(gòu)體識(shí)別上具有優(yōu)異的性能,以在小鼠肝臟代謝組為例,Met4DX精準(zhǔn)識(shí)別代謝物同分異構(gòu)體數(shù)目高達(dá)3033對(duì),比同類技術(shù)顯著提升3.6倍,并且可準(zhǔn)確識(shí)別出CCS差異為1% 的共流出同分異構(gòu)體。同時(shí),本文還收集了 HMDB 和KEGG中的超過(guò)13萬(wàn)個(gè)代謝物,建立了目前最全面的四維代謝物數(shù)據(jù)庫(kù)用于代謝物的多維匹配與鑒定。
目前 Met4DX 支持包括 布魯克timsTOF 和 安捷倫 DTIM-MS 等儀器平臺(tái)采集的四維代謝組學(xué)數(shù)據(jù)。為了方便相關(guān)領(lǐng)域研究者應(yīng)用該工具,課題組提供了docker供學(xué)術(shù)界用戶免費(fèi)使用Met4DX(https://hub.docker.com/r/zhulab/met4dx-r)。該工作所開(kāi)發(fā)的四維代謝組學(xué)精準(zhǔn)分析技術(shù)Met4DX已經(jīng)申請(qǐng)了國(guó)家發(fā)明專利和國(guó)家軟件著作權(quán)。相關(guān)技術(shù)和軟件的商業(yè)用途需要聯(lián)系朱正江研究員進(jìn)行授權(quán)使用。
該工作得到了國(guó)家自然科學(xué)基金委、科技部、中國(guó)科學(xué)院、上海市科委等的資助。
附件下載:

