谷歌推出可識別蛋白質(zhì)結(jié)晶的AI,用于藥物發(fā)現(xiàn)互聯(lián)網(wǎng)+
Google Brain研究小組開發(fā)人工智能視覺技術(shù),可分析蛋白質(zhì)結(jié)晶分子結(jié)構(gòu)。
谷歌大腦團隊的成員今天宣布,他們已經(jīng)開發(fā)了用于識別蛋白質(zhì)結(jié)晶的計算機視覺,聲稱準(zhǔn)確率約為94%。 蛋白質(zhì)結(jié)晶決定了細胞的形狀,對于發(fā)現(xiàn)治療各種疾病的藥物中有很大作用。
Google Brain首席科學(xué)家Vincent Vanhoucke今天在一篇博文中說:“每種蛋白質(zhì)的功能性篩選通常要進行數(shù)百次實驗,雖然檢測和成像大多是自動化的,但發(fā)現(xiàn)單個蛋白質(zhì)晶體仍主要通過視覺檢查來完成,因此容易出現(xiàn)人為錯誤。至關(guān)重要的是,錯過這些結(jié)構(gòu)可能導(dǎo)致喪失重要的生物醫(yī)學(xué)發(fā)現(xiàn),失去推動醫(yī)學(xué)發(fā)展的機會。"
為了訓(xùn)練AI模型,Google研究人員與結(jié)晶結(jié)果的機器識別(MARCO:Machine Recognition of Crystallization Outcomes)工作小組合作。MARCO是由制藥公司和學(xué)術(shù)界各作進行的項目,旨在收集大量具有代表性的蛋白質(zhì)結(jié)晶圖像及其元數(shù)據(jù),并與晶體學(xué)界以外的圖像分析專家分享。
Google Brain和MARCO小組之間的工作成果已經(jīng)在GitHub上發(fā)布,該模型使用深度卷積神經(jīng)網(wǎng)絡(luò)對結(jié)晶結(jié)果進行分類。將結(jié)晶實驗圖像輸入該模型,會將其歸屬于晶體,沉淀物,透明物質(zhì)或“其他物種”四種類別之一。
在PLOS One期刊上發(fā)表的論文中對識別蛋白質(zhì)晶體結(jié)構(gòu)的模型做了詳細介紹:晶體結(jié)果的機器識別(MARCO)計劃已經(jīng)通過各種來源組裝了大約50萬個大分子結(jié)晶實驗的注釋圖像。在該數(shù)據(jù)集的不同部分上訓(xùn)練和測試最先進的機器學(xué)習(xí)算法,我們發(fā)現(xiàn)對于各種實驗來源的測試圖像超過94%的可以被正確標(biāo)記。晶體識別是高密度篩選和實驗系統(tǒng)分析的關(guān)鍵,利用這種算法可以打開行業(yè)基礎(chǔ)研究的大門。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。