9 月 25 日消息,科技媒體 9to5Mac 昨日(9 月 24 日)發(fā)布博文,報(bào)道稱蘋果研究團(tuán)隊(duì)發(fā)布了輕量級蛋白質(zhì)折疊預(yù)測 AI 模型 SimpleFold,采用流匹配(Flow Matching)方法替代多序列比對(MSA)等復(fù)雜模塊,大幅降低計(jì)算成本。

該媒體指出 AlphaFold2(Google DeepMind 的突破性 AI 模型)、RoseTTAFold 等傳統(tǒng)模型雖然具備更高的精度,但由于依賴多序列比對、三角更新等計(jì)算密集的特定架構(gòu),訓(xùn)練與推理成本高昂。蘋果團(tuán)隊(duì)希望通過簡化結(jié)構(gòu),降低硬件門檻,讓更多科研團(tuán)隊(duì)受益。

SimpleFold 核心采用 2023 年提出的流匹配(Flow Matching)方法,這種技術(shù)源自擴(kuò)散模型,但在生成過程中不逐步去噪,而是直接從隨機(jī)噪聲一次生成目標(biāo)結(jié)構(gòu)。相比逐步迭代的擴(kuò)散模型,這種方式跳過多個(gè)去噪環(huán)節(jié),計(jì)算量更低、生成速度更快,已在文本生成圖像和 3D 建模領(lǐng)域獲得成功。
在實(shí)驗(yàn)中,研究人員分別訓(xùn)練了從 100M 到 3B 參數(shù)的多個(gè)版本,并在 CAMEO22 和 CASP14 兩大權(quán)威基準(zhǔn)上進(jìn)行評估。
這些測試覆蓋了模型在泛化性、魯棒性(Robustness,一個(gè)系統(tǒng)或過程在面臨干擾、不確定性或異常輸入時(shí),仍能維持其功能或穩(wěn)定運(yùn)行的能力)和原子級精度上的表現(xiàn),結(jié)果顯示,SimpleFold 在性能上穩(wěn)定優(yōu)于同類流匹配模型 ESMFlow,并媲美頂尖模型表現(xiàn)。

具體來看,SimpleFold 無需使用昂貴的多序列比對和三角注意機(jī)制,在 CAMEO22 上達(dá)到 AlphaFold2、RoseTTAFold2 約 95% 的性能。更小的 SimpleFold-100M 版本在保持高效的同時(shí),性能超過 ESMFold 的 90%,驗(yàn)證了通用架構(gòu)模塊在蛋白質(zhì)預(yù)測領(lǐng)域的可行性和競爭力。

研究還發(fā)現(xiàn),隨著模型規(guī)模和訓(xùn)練數(shù)據(jù)增加,性能穩(wěn)定提升,尤其在高難度測試中優(yōu)勢明顯。蘋果團(tuán)隊(duì)強(qiáng)調(diào),SimpleFold 只是起點(diǎn),希望它能推動社區(qū)構(gòu)建更多高效、強(qiáng)大的蛋白質(zhì)生成模型,進(jìn)一步加速藥物研發(fā)和新材料探索。

附上參考
Apple researchers develop SimpleFold, a lightweight AI for protein folding prediction
SimpleFold: Folding Proteins is Simpler than You Think
本文鏈接:http://m.www897cc.com/showinfo-45-28166-0.html科研利器:蘋果發(fā)布輕量 AI 模型 SimpleFold,降低蛋白質(zhì)預(yù)測計(jì)算成本
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com