DeepMind宣佈基於AI的蛋白質模型預測獲得初步進展
【獵雲網(微信號:)】12月6日報道 (編譯:孫洋)
谷歌的人工智慧專家和DeepMind公司發表宣告,稱他們已經使用人工智慧,在僅僅基於基因序列的情況下,就可以預測蛋白質複雜的三維結構,這是一個“重要的里程碑”。
瞭解蛋白質結構對疾病診斷和治療有重要意義,可以提高科學家對人體的認識,並可能有助於蛋白質設計和生物工程技術。
兩年前,在一篇關於利用人工智慧來預測蛋白質摺疊結構的部落格文章中寫道:“構建蛋白質的三維模型是生物學的核心挑戰之一,AlphaFold (DeepMind公司的人工智慧)構建的模型在準確度上得到了很大的提高,這是生物學上的重大進步。”
預測蛋白質分子怎樣從DNA上附著的氨基酸轉化而來(即蛋白質鏈如何摺疊到三維狀態)有各種各樣的方法。
但是,對三維結構進行建模是一項非常複雜的任務,因為蛋白質摺疊排列組合取決於多種因素,例如氨基酸之間的相互作用。甚至有一個眾包遊戲(FoldIt),試圖利用人類的直覺來預測可行的蛋白質結構。
DeepMind公司說,它的方法是基於多年的超前研究,嘗試利用大資料來預測蛋白質結構。具體來說就是利用深度學習處理基因組資料。
部落格中寫到:“幸運的是,由於基因測序的成本迅速降低,基因組學領域的資料變得非常豐富。因此,基於基因組資料進行預測的深度學習在過去幾年變得流行起來。DeepMind因而開發了AlphaFold,今年我們已經將其提交到了CASP(注:蛋白質結構預測的相關的一個大會)。”
“CASP的組織者稱我們在預測蛋白質結構計算方面取得了前所未有的進步,我們感到自豪,我們在大會參與者中位居第一梯隊(我們的位置是A7D)。”
“我們的團隊攻關的是硬骨頭,從零開始搭建目標結構,並不需要已有的方案作為模板。我們預測蛋白質結構的物理特性,達到了很高的準確性,然後用兩種不同的方法來構建完整蛋白質結構的預測模型。”
DeepMind公司說,這兩種方法都是基於經過訓練的深度學習神經網路,根據基因序列預測蛋白質的性質。
“我們的神經網路預測的性質包括:(a)氨基酸對之間的距離以及(B)連線這些氨基酸之間的化學鍵的角度。第一個進步是判斷氨基酸對是否彼此靠近的技術得到了發展。”
“我們訓練了一個神經網路來預測蛋白質中每對氨基酸之間距離的分佈情況。然後,這些概率被組合成一個評分,估計構建的蛋白質結構的準確度。我們還訓練了另外一個神經網路,利用計算出來的距離來估計構建的蛋白質結構的正確程度。
然後,使用新的方法嘗試構建蛋白質的預測結構,並搜尋與預測相匹配的結構。
“我們的第一種方法建立在結構生物學中常用的技術上,並用新的蛋白質片段反覆替換蛋白質結構種的片段。我們訓練了一個神經網路用於創造新的片段,並利用它們來不斷提高蛋白質結構的預測分數。”
“第二種方法通過梯度下降的演算法來優化分數,梯度下降是機器學習中常用的一種演算法,能夠產生小而累積的優化提升,這種方式也可以獲得高預測準確性。這項技術應用於整個蛋白質鏈,而不是片段,在裝配之前必須要單獨摺疊,從而降低預測的複雜程度。
DeepMind公司將取得的成果稱為“使用計算方法計算蛋白質摺疊取得的早期進展”,並且聲稱這體現了人工智慧在科學研究中的應用。
當然,它也強調,確定深度學習到底能夠產生多大的影響,還為時尚早。
“儘管距離我們能夠對疾病治療、環境管理等方面產生明顯的影響還有很長的路要走,但我們知道它的潛力是巨大的。我們有一個專門的團隊研究機器學習如何推進科學的進步,我們期待我們的技術能夠在多領域有所作為。”
AD:12月7-8日,北京望京凱悅酒店!獵雲網邀您共赴創投盛宴“聚勢謀遠 創變未來—2018年度CEO峰會暨獵雲網創投頒獎盛典 ”,觀創投風雲再起,賞行業大咖論道,共同見證科技創業浪潮中的創業新生力量!