機器學習進軍藥物開發

編譯|許晉華

近年來,人工智慧快速蓬勃發展,結合大數據開創新局,應用層面遍及經濟、工業和娛樂,相較之下,AI在化學產業的應用卻顯得緩慢,但可望出現轉機,因為專家團隊已展開多項合作和研究,決心突破限制以縮短差距,有些研究團隊計畫將深度學習應用在藥物開發中,其中的典型代表為GSK製藥公司和政府實驗室的合作,該公司試圖利用大量化合物的篩選數據來尋找新藥物;除此之外,也有其他研究致力於透過AI找出化學合成路徑。

AI帶領藥物開發產業走向新世代

開發藥物的成本約每九年會增加一倍,目前統計為25億美元,許多人將其歸咎於化學資訊科學 (cheminformatics),儘管已投入龐大資金於搜尋和將藥物對位到各種蛋白質和靶標分子上,但效果仍有限;不過有些化學家認為隨著資訊科技的進步、取得大數據的可能性和強大的深度學習算法,也許能和AI結合,擬定出更卓越的電腦輔助藥物開發方法,並降低製藥成本。

幾十年來,化學家使用傳統的機器學習方法不斷地找尋可作為新藥物的化合物,但自從看見AI在數個領域中的成功後,他們也開始期待AI能為製藥帶來一道曙光並扭轉困境,資金開始湧向各家提供不同深度平台的新創公司,例如:twoXAR最近籌措了340萬美元的種子資金,Atomwise也募集到600萬美元。

然而,AI應用於藥物開發必須面臨種種考驗,其中之一為化學大數據的取得,由於深度學習的表現取決於訓練資料數量的多寡,是否能獲取大量資料事關重大,但這在化學領域中仍相當困難;另外,化學家也必須開發一些方法以確保AI所「發現」的分子是確實能被合成的。

儘管Relay Therapeutics的科學總監Mark Murcko表示,尚未證明AI比傳統機器學習方法能更有效地找出新藥物,但越來越多團隊結合化學家及資訊科學家投入相關研究,北卡大學教堂山分校的資訊化學家Olexandr Isayev認為,雖然基於AI的化學應用僅起步2年,但進步相當可觀,如Atomwise的深度學習架構AtomNet已協助開發預防感染伊波拉病毒的藥物,並取得FDA的認可評估,其成功也讓化學家們看見深度學習的潛力。

蔚山科學技術院的化學教授Bartosz Grzybowski進一步解釋在設計藥物的過程中,AI查看的是分子的各個方面,它所識別的是用來阻斷G蛋白偶聯受體 (GPCRs)的分子─高達40%的現代藥物都以它作為靶點,基於此進一步研發新藥,他同時也提到,要把這些資訊全都理解吸收是非常困難的。

近期一系列結合AI的藥物研究,也陸續在各期刊上發表,史丹佛大學的化學教授Vijay Pande帶領的研究小組正在和Google合作,利用Google提供的龐大神經網路系統來搜尋候選藥物,該小組不斷在訓練AI,使它能找出如何抑制 BACE1 的酶活性,用於治療阿茲海默症;另外Insilico Medicine化學家Alexander Aliper等人使用AI來預測藥理特性等;由IBM Watson的Cicero Nogueira dos Santos 所領導的團隊也致力於研究如何使用深度學習來提高藥物虛擬篩選和藥物對位到其靶標分子上的成功率。

比起電腦視覺和語音識別等領域,藥物開發仍面臨更大的挑戰,如同前述化學大數據的考驗,直到近日才逐漸有一些資料集可供取用,為了解決這個問題,有人希望製藥業可以打破傳統,共享資訊以獲取更多的數據,但仍有相當大的爭議;Olexandr Isayev認為若能將整個分子的表徵作為深度學習的輸入,將會大幅提升AI對分子的認知能力,但就現況而言,尚無法做到這一點,無論如何,深度學習已為化學產業開創新局,隨著更多研究團隊及龐大資金的投入,藥物開發的成功指日可待。

AI和化學家─亦師亦友的關係

雖然應用AI於開發新藥的系列研究備受矚目,但仍有許多化學家希望能精進自己的專業能力,借助深度學習的力量從大數據中學習,讓他們有效地吸收到更多科學知識,其中一項相關的新興應用即為電腦輔助設計化學合成路徑─以目標分子作為輸入,透過AI找出可行的反應路徑。

然而機器學習並非在任何情況下都能發揮作用,舉例來說,Chematica所開發的ChemPlanner並無法直接從文獻等資料中產生一組化學反應規則,除了常見的反應式外,都需要人類共同參與,確認並編寫關鍵反應式;另外對於較複雜的合成反應來說,罕見的反應式會變得非常關鍵,但它們可能只有在文獻資料中出現幾次,在缺乏大數據的狀況下,電腦無法學習出此類反應式的特徵,因此化學家必須將核心的反應式輸入電腦中,例如:反應過程中會變化的鍵結,甚至需要規定在什麼時間點、何種方式結合其他可能會影響該反應的反應物─芳香烴和吸電子基團等,該軟體便能基於這些規則來確定發生的反應式,而機器學習在此擔任的角色則是在廣大網路中尋找可能的合成路徑。

機器學習同時也會在眾多可能的合成路徑中進行評估,依據高低排序並提供給使用者參考,但其評估的方式沒有一定的標準,隨著不同化學家的期望和偏好,會根據成本、產量和步驟數量等因素來調整優先順序,擔任ChemPlanner的產品經理Orr Ravitz提到他們希望未來的機器學習能從使用者行為中交互學習,做到客製化。

深度學習在產出化學反應合成路徑方面也有許多相關研究,其中值得注意的是Haverford研究團隊反向操作,利用”dark reactions”─綜合失敗或無法執行的反應途徑來協助訓練模型,他們甚至設置了一個網站 (darkreactions.haverford.edu) 專門蒐集相關資訊,有專家聲稱,隨著深度學習的發展,此類的負面資訊將會日趨重要。

除了應用於實務層面外,AI也衍伸到教育方面,Elsevier的CTO表示他們正在嘗試透過深度學習算法來學習學生是如何吸收課堂知識,藉此他們認為將能因材施教,刺激學生的學習欲望並提升學業表現。無論AI會應用在化學中哪一個產業,我們都相信AI將來在此領域將會突破現況,帶來亮眼的成果。

 

原文出處: New directions for machine learning

參考文獻:

[1] Machine-learning-assisted materials discovery using failed experiments
[2] AtomNet: A Deep Convolutional Neural Network for Bioactivity Prediction in Structure-based Drug Discovery
[3] Boosting Docking-Based Virtual Screening with Deep Learning

2,301 人瀏覽過