新型抗生素開發,機器學習立大功
編譯/許守傑
研發新型抗生素的嚴峻挑戰
長久以來,新型抗生素的研發一直是個枯燥冗長的過程。生物學家必須花上無數小時在土壤中反覆翻找能夠殺死有害細菌的微生物,並分離出有效成分。然而伴隨著具有抗藥性的超級細菌開始大幅傳播後,尋找未受污染的新疆土變得益發困難,研發新型抗生素的突破機會也越來越少。所幸人工智慧為生物學家們提供了一個絕佳的機會,將搜尋場所由野外轉移至分子資料庫,探索過去不曾發現的抗生素結構。
日前,麻省理工學院電腦科學和人工智慧教授Regina Barzilay與生物工程學教授James Collins共同合作,透過機器學習找出能夠抵抗世界上最頑強病原體的潛力分子。他們的研究主要是使用一種稱為「消息傳遞神經網路」(Message Passing Neural Network,MPNN)的模型,使用特別的處理層來分析分子結構以篩選出想要的分子特性。
消息傳遞神經網路
首先從機器學習的角度來看,分子結構其實天生就相當適合用以訓練模型:以原子為結點、化學鍵為連線,對於圖形數據而言,這種圖形的對稱不變性是機器學習模型一個特別理想的屬性,並且在這一領域也有許多有趣的研究。而MPNN的特點,就在於學習圖的資訊,將圖作為輸入後,給出屬性的預測。
更詳細地來說,MPNN的結構分為兩個階段:消息傳遞階段(Message passing phase)以及讀出階段(Readout phase)。消息傳遞階段消化輸入的圖並蒐集其結構的資訊,建立神經表徵(neural representation);讀出階段則使用一個讀出函數來計算出屬性的預測值。回到上述的例子,研究人員會將分子結構轉換為原子與化學鍵的圖用以訓練MPNN,而後模型輸出分子的量子態,讓科學家能找到感興趣的分子特性。
結果與成效
這項研究中,研究人員最終在機器的協助下發現了一種被稱為halicin的分子,可以有效治療胃腸道的難治梭狀芽胞桿菌(Clostridium difficile)。除此之外,還發現了其他八種抗菌化合物,它們的結構與已知的抗生素有很大的差異。Collins表示:「利用人工智慧能夠非常直接地降低抗生素開發階段的成本。有了這些模型,我們現在可以用更短的時間與花更少的錢來找到新的化學分子。」
史丹福大學的生醫資訊學教授Nigam Shah也說:新方法將分子的搜索空間擴展到了我們以往所不知道的維度。雖然找出有希望的分子只是抗生素開發中的第一步,但機器學習無疑大大地加快了生物學家臨床前置工作,並使研究人員更有信心,相信他們所找到的分子能通過後續更昂貴、更嚴格的考驗,成為實際藥品。
編譯來源
C. Ross, “Aided by machine learning, scientists find a novel antibiotic able to kill superbugs in mice”, STAT, 2020
參考資料
- J. Gilmer et al., “Neural Message Passing for Quantum Chemistry”, arXiv.org, 2017
- G. Dahl et al., “Predicting Properties of Molecules with Machine Learning”, Google AI blog, 2017
- M. Abdughani et al., “Probing stop pair production at the LHC with graph neural networks”, Springer, 2019
(本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯)