2021728
    圖片來源:deepmind 網頁

    DeepMind 研究新突破 以人工智能預測蛋白質 3D 結構

    說到 DeepMind ,相信大部份人都會想起數年前的圍棋大賽。不過,這間 Google 旗下公司的最新研究成果 AlphaFold ,成功利用人工智能 (AI) 幫助找出蛋白質的立體結構。

    蛋白質是由不同胺基酸 (amino acid) 所組成,更是生命構成的重要結構。蛋白質的運作機制和相應功能,都是取決於其立體形狀結構。要找出它們的結構,其中一類方法是透過被稱為「黃金標準」的實驗方法 —— X 光晶體學 (Crystallography) 或者用低溫電子顯微鏡 (Cryo-EM) 。

    另一方法則是透過電腦運算,嘗試推測胺基酸序列會組成甚麼形狀的蛋白質結構,以加快涉及蛋白質結構的研究工作。然而,初期的電腦模擬技術運算所得的結果強差人意,未能準確、有效地推斷到蛋白質形狀。

    馬里蘭大學計算生物學家 John Moult 因此就在 1994 年設立雙年舉行的蛋白結構預測挑戰賽 (Critical Assessment of Structure Prediction, CASP) 。繼 2018 年後,DeepMind 今年再參與 CASP,但今屆他們所研發的人工智能系統 AlphaFold 表現不僅比另外約 100 隊參加隊伍理想,而且有份評審的科學家更形容為可預示生物學新一場革命。

    AlphaFold 預測與「黃金標準」結果相近

    在今次挑戰中, DeepMind AlphaFold 在預測部份蛋白結構時,表現甚至與有「黃金標準」之稱的實驗方法所得的結果一樣。短期內, AlphaFold 雖未能直接取替最標準、可靠的黃金標準,但現時仍協助科學家以新方法研究蛋白質結構。

    帶領開發 AlphaFold 的 DeepMind 科學家 John Jumper 解釋,最初他們將預測系統分作兩部份,首先透過深度學習從結構及基因數據中,尋找著蛋白質內胺基酸對距離的模式,之後再以此設計出一套運算模型預測蛋白結構。然而,他們發現此方法效果不太理想, DeepMind 研究人員再在 AI 系統中,加入一些物理及幾何結構的限制後,直接訓練系統預測結構,而非胺基酸關係的模式。

    Moult 指,所有隊伍在今屆比賽中表現都比去年出色。其中,在中等難度的題目中,各隊最高得分平均為 75 分(100 分為滿分),但 DeepMind 表現尤其出眾,獲得約 90 分的佳績。除 DeepMind 外,不少學術研究隊伍,以及微軟和騰訊都有派出隊伍參與。

    DeepMind 創辦人之一的 Demis Hassabis 計劃將 AlphaFold 改造,讓系統更適合生物學家使用。他們的團隊也公開發表了初代 AlphaFold 的研究成果,可供科學家參考。不過, Hassabis 指現時系統仍須一段時間才可預測到蛋白立體結構,而他們也在了解生物學家對系統有甚麼特別需求,相信將可應用於藥物開發或者蛋白質設計中。 DeepMind 年初也發表了他們對於武漢肺炎病毒 (SARS-CoV-2) ,其中一種名為 Orf3a 蛋白結構的預測,而結果也與實驗觀察到的相近。

    來源:
    Nature, ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures, 30 November 2020

    文/Edward Ho

    編輯推介

      發表意見