拿下諾貝爾化學(xué)獎(jiǎng),類谷歌AlphaFold開源蛋白質(zhì)大模型
相信很多大家對拿下諾貝爾化學(xué)獎(jiǎng),類谷歌AlphaFold開源蛋白質(zhì)大模型還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
本周谷歌DeepMind聯(lián)合創(chuàng)始人兼首席執(zhí)行官Demis Hassabis憑借AlphaFold系列模型拿下諾貝爾化學(xué)獎(jiǎng),創(chuàng)造了AI大模型首次拿下諾獎(jiǎng)的歷史。
尤其是最新發(fā)布的AlphaFold-3在生物分子結(jié)構(gòu)、蛋白-配體結(jié)構(gòu)、生物復(fù)合體等方面獲得了很大提升,可顯著加速人類對新藥物的研發(fā)進(jìn)程。
但AlphaFold-3模型是閉源的,并且在使用方面對于一些國家/地區(qū)也存在限制。所以,AI研究團(tuán)隊(duì)Chai開源了類似的多模態(tài)分子結(jié)構(gòu)預(yù)測模型Chai-1。
開源地址:https://github.com/chaidiscovery/chai-lab/
在線地址:https://lab.chaidiscovery.com/auth/login?
雖然最近兩年很多大模型也能預(yù)測蛋白質(zhì)結(jié)構(gòu),但在多聚體預(yù)測或蛋白質(zhì) - 配體相互作用等方面的表現(xiàn)并不理想。
這是因?yàn)榈鞍踪|(zhì)多聚體的結(jié)構(gòu)和相互作用非常復(fù)雜,涉及到多個(gè)蛋白質(zhì)分子之間的精確排列和相互作用。使得模型在處理這種復(fù)雜性時(shí)可能存在困難,難以準(zhǔn)確捕捉到多聚體中各個(gè)蛋白質(zhì)分子之間的微妙相互作用和空間關(guān)系。
例如,多聚體中蛋白質(zhì)分子的相對取向、結(jié)合位點(diǎn)的精確位置以及分子間的動(dòng)態(tài)變化等因素對于其功能和活性至關(guān)重要,但現(xiàn)有的大模型可能無法充分考慮這些因素,導(dǎo)致預(yù)測結(jié)果不夠準(zhǔn)確。
而Chai-1的模型架構(gòu)充分考慮了蛋白質(zhì)多聚體的復(fù)雜性,使用了多種先進(jìn)的技術(shù)來提高對多聚體結(jié)構(gòu)和相互作用的預(yù)測能力。
在模型架構(gòu)方面,Chai -1通過引入來自大型蛋白質(zhì)語言模型的殘基級(jí)嵌入,能夠更好地捕捉蛋白質(zhì)序列中的信息,從而提高在單序列預(yù)測方面的能力。使得模型在處理缺乏多序列比對信息的情況時(shí),仍然能夠準(zhǔn)確預(yù)測蛋白質(zhì)的結(jié)構(gòu)。
Chai -1還添加了約束特征,包括口袋約束、接觸約束和對接約束等。這些約束特征能夠模擬實(shí)驗(yàn)中觀察到的蛋白質(zhì)與其他分子之間的相互作用,幫助模型更準(zhǔn)確地捕捉多聚體中各個(gè)蛋白質(zhì)分子之間的微妙相互作用和空間關(guān)系。
例如,口袋約束可以指定蛋白質(zhì)口袋與配體之間的距離限制,接觸約束可以模擬蛋白質(zhì)分子之間的接觸情況,對接約束可以幫助模型確定蛋白質(zhì)分子的相對取向。
此外,Chai -1在處理多聚體中蛋白質(zhì)分子的相對取向時(shí),能夠利用其強(qiáng)大的計(jì)算能力和優(yōu)化算法,對各種可能的取向進(jìn)行全面的搜索和評估,從而找到最優(yōu)的取向組合。
對于結(jié)合位點(diǎn)的精確位置,Chai -1通過對大量訓(xùn)練數(shù)據(jù)的學(xué)習(xí),能夠識(shí)別出微小的結(jié)構(gòu)特征和化學(xué)信號(hào),從而更準(zhǔn)確地確定結(jié)合位點(diǎn)的位置。
同時(shí),Chai -1還能夠模擬分子間的動(dòng)態(tài)變化,考慮了蛋白質(zhì)分子的柔性和運(yùn)動(dòng)性,通過引入動(dòng)態(tài)模型或采用機(jī)器學(xué)習(xí)算法來捕捉分子間的動(dòng)態(tài)相互作用,從而更好地預(yù)測多聚體在不同條件下的結(jié)構(gòu)和功能。
根據(jù)測試數(shù)據(jù)顯示,Chai -1僅根據(jù)蛋白質(zhì)序列和配體的化學(xué)組成,實(shí)現(xiàn)了77%的配體 RMSD 成功率,與 AlphaFold3的76%相當(dāng);
在一個(gè)包含268個(gè)界面、跨越129個(gè)結(jié)構(gòu)的評估集中,Chai-1無論是使用或不使用多重序列比對,在單序列模式下在抗體-蛋白的預(yù)測上顯著優(yōu)于AlphaFold2.3。這表明Chai-1在處理抗體這類高度變異的免疫蛋白質(zhì)序列時(shí)快速且準(zhǔn)確率非常高。
以上就是關(guān)于【拿下諾貝爾化學(xué)獎(jiǎng),類谷歌AlphaFold開源蛋白質(zhì)大模型】的相關(guān)內(nèi)容,希望對大家有幫助!