
上海有機(jī)所交叉中心開(kāi)發(fā)原子互作生成模型Void-X用于蛋白質(zhì)界面設(shè)計(jì)
精準(zhǔn)預(yù)測(cè)蛋白質(zhì)-蛋白質(zhì)/藥物在原子層面的相互作用,并通過(guò)蛋白質(zhì)設(shè)計(jì)技術(shù)精確調(diào)控這些根本的相互作用,在加速療法開(kāi)發(fā)和解決未滿足的醫(yī)療需求方面具有巨大的潛力。隨著腺相關(guān)病毒(AAV)和mRNA脂質(zhì)納米顆粒(LNP)等蛋白質(zhì)遞送技術(shù)的快速發(fā)展,以組織特異性的方式遞送設(shè)計(jì)的胞內(nèi)或胞外蛋白質(zhì)已日益可行。
盡管以Transformer和Diffusion模型為代表的生成式AI框架,已加速了針對(duì)特定結(jié)構(gòu)表位的從頭蛋白質(zhì)設(shè)計(jì),但當(dāng)前大多數(shù)方法仍遵循一種自上而下(top-down)的策略:首先生成一個(gè)能夠適配目標(biāo)位點(diǎn)的整體蛋白質(zhì)骨架,隨后再設(shè)計(jì)蛋白質(zhì)序列以優(yōu)化結(jié)合能力。
2026年6月9日,中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所生物與化學(xué)交叉研究中心周界文與袁鈞瑛團(tuán)隊(duì)在Proceedings of the National Academy of Sciences (PNAS)上發(fā)表了題為“Void-X: A generative void-filling model for predicting atomic packing in proteins”的研究論文,開(kāi)發(fā)了原子互作生成模型Void-X,一種采用自下而上(bottom-up)的范式設(shè)計(jì)蛋白質(zhì)界面。與現(xiàn)有方法先設(shè)計(jì)整體蛋白質(zhì)形狀不同,Void-X能夠針對(duì)特定結(jié)構(gòu)區(qū)域直接生成與之匹配的互作原子分布,從而為蛋白質(zhì)-蛋白質(zhì)界面設(shè)計(jì)奠定了物理可解釋的基礎(chǔ)。

Void-X作為一種原子填充模型,旨在捕捉原子尺度的相互作用模式,并填補(bǔ)蛋白質(zhì)界面中的原子空位(圖1)。為了訓(xùn)練該模型,研究團(tuán)隊(duì)從蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB)中精心篩選并構(gòu)建了超過(guò)800萬(wàn)個(gè)球形原子簇。在每個(gè)原子簇中,約30%位于外圍且空間中連續(xù)的原子被掩碼以待生成,其余原子則作為上下文信息。Void-X模型擁有1.7億個(gè)參數(shù),在蛋白質(zhì)鏈內(nèi)原子簇預(yù)測(cè)任務(wù)中的準(zhǔn)確率達(dá)到78.3%,在蛋白質(zhì)鏈間原子簇預(yù)測(cè)任務(wù)中的準(zhǔn)確率為68.2%。

圖1. Void-X原子填充模型訓(xùn)練流程圖
憑借這些能力,Void-X能夠直接生成原子級(jí)別的蛋白質(zhì)相互作用,為蛋白質(zhì)設(shè)計(jì)開(kāi)辟了一條直觀且全新的路徑(圖2)。該模型將原子層面的精細(xì)信息與生成模型融為一體,極大地豐富了生物分子界面的理性設(shè)計(jì)手段,在藥物研發(fā)等領(lǐng)域擁有較大的應(yīng)用潛力。

圖2. Void-X生成的原子分布示例(低信息熵)??傮w而言,這些局部結(jié)構(gòu)包含多個(gè)氨基酸片段,且大多數(shù)氨基酸均呈現(xiàn)出完整的側(cè)鏈結(jié)構(gòu)。
中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所生物與化學(xué)交叉研究中心袁鈞瑛院士和周界文研究員為本文的通訊作者,楊靜副研究員為第一作者。以上工作得到了國(guó)家自然科學(xué)基金委、中國(guó)科學(xué)院、上海市科委的大力資助和支持。
原文鏈接:https://www.pnas.org/doi/10.1073/pnas.2607035123
附件下載:

