NeurIPS 2018 | 藥物發現領域的ImageNet誕生!Insilico Medicine推出全新資料基準平臺
今日,一年一度的人工智慧頂級會議NeurIPS開幕了。今年的大會新增了Expo環節,吸引了全球32家公司的參與。其中,Insilico Medicine在會上展示了他們最新的 MOSES(Molecular Sets)平臺 ,並宣佈將這項研究開放,邀請更多的研究人員和團隊向平臺開放資料集和模型,從而對該平臺進行擴充套件。
MOSES平臺由Insilico Medicine、Neuromation及Alán Aspuru-Guzik實驗室合作完成。MOSES是一個涵蓋多種不同機器學習技術的基準平臺,可以將資料集與標準資料集作比較,被看作是藥物發現領域的“ImageNet”。根據預先定義好的指標,MOSES可以實現幾種流行的分子生成模型,並對它們進行評級。MOSES旨在加快藥物發現的速度,促進新模型的共享和比較。 就像ImageNet可以促進成像資料的深度學習一樣,MOSES的目標是促進人工智慧驅動的藥物發現。
隨著機器學習的研究不斷髮展,尤其是深度學習方面,其可複製性方面的問題和對不同方法進行客觀比較開始出現。雖然用機器學習模型生成新型分子結構的方法有很多,但是執行和評估這些生成模型表現的常規方法還未形成。 MOSES平臺可以提供一個標準化的基準資料集和一組統一實施的開源模型,以及用於評價和評估生成結果的指標。
▲MOSES平臺的示意圖(圖片來源:Insilico Medicine)
“2015年,我們剛開始使用GAN來研究生成化學的時候,這種方法還是一門未經證實的奇特技術。而現在這一技術已通過實驗驗證,並且這個領域正在經歷爆炸性擴張,許多團隊紛紛加入,並做出了有意義的貢獻。”Insilico Medicine的創始人兼執行長Alex Zhavoronkov博士表示:“我們相信,制定一套標準和基準,從而服務於整個行業,加快向患者提供由AI幫助研發的藥物,這一點是非常重要的。”
Insilico Medicine 的首席技術官Alexander Zhebrak先生說道:“Insilico Medicine非常重視機器學習模型的可重複性和客觀評估。隨著生成AI的應用在藥物發現領域日益普及,開發一個由研究界支援和維護的標準化基準平臺的需求也越來越明顯。 有了MOSES,我們就可以通過先進的計算和機器學習方法,生產更好的藥物化合物 ,這樣一來,我們離整個行業創新發展的終極目標又更近了一步。”
▲ Insilico Medicine的人工智慧在衰老研究和長壽生物技術方面的應用,包括防衰老劑發現、衰老時鐘、生物標誌物開發、分子相似性評分、跨物種衰老研究AI和目標識別6個方面(圖片來源:Insilico Medicine)
此外,Insilico Medicine還在大會上對於AI驅動衰老和延長壽命領域的研究進行了一些總結和展望。Zhavoronkov博士表示, 年齡是最豐富的生物學特徵之一 。儘管個體的資料可能會出現不同程度上的缺失,但年齡的資料永遠是最直觀可得的。其次,深度學習年齡預測因子是一個非常好的手段,來整合此前不相容的資料型別,如視訊影像和血液測試結果等。第三,以年齡為條件,利用生成對抗網路(GANs)來生成新的生物資料,是產生高質量合成數據的好辦法。
同時,Zhavoronkov博士還在相關論文中寫道,我們可以將衰老視為一種分階段的疾病,以便對組織特異性水平和系統水平的生物學過程形成全面的瞭解,這也讓深度神經網路(DNN)更易於解讀,幫助我們建立因果圖並識別生物學目標。同時,我們或許能用年齡資料訓練DNN,用特定疾病來重新訓練模型。而且,我們還可以利用生物衰老時鐘,生產個性化免疫療法和疫苗,發現提高應答率的新方法。
參考資料:
[1] AI researchers join forces to develop the 'ImageNet' of generative drug discovery. Retrieved December 4, 2018, from https://eurekalert.org/pub_releases/2018-11/imi-arj113018.php
[2] Artificial intelligence tracks biological age at every level and rewinds the aging clock. Retrieved December 4, 2018, from https://www.eurekalert.org/pub_releases/2018-12/imi-ait120218.php