【探索22-6】微觀生物 – 用計算力解開基因與蛋白質密碼

在人工智慧(Artificial Intellegent)及機器學習(Machine Learning)如火如荼的發展下,生物領域漸漸走向資訊化,過往需要花數個月甚至數年所計算出的生物分子模型或是蛋白質結構,如今在計算機程式的運算下,僅需要幾個小時,甚至幾分鐘就可以達成。生物與資訊的跨領域結合,將帶來什麼樣的應用及如何影響我們的生活,本場探索演講「計算生物的見與思」,將帶領我們了解計算與生物的相輔相成與應用。

講者|交通大學科技系暨生物資訊與系統生物所教授 朱智瑋
彙整撰文|廖梓甯

●什麼是計算生物 (Computational Biology)

計算生物,也就是以計算力來認識生物領域的知識。不論是物種間的差異或疾病機制,都與基因及蛋白質的表現息息相關。因此在分子生物領域中,最大宗的資料量來源其實是基因,由ATCG所組成的基因序列,因著不同的排列而能轉譯成不同的蛋白質,產生特定的功能協助生理運作,這就是分子生物學的中心法則,由DNA轉錄成RNA,再由RNA轉譯成蛋白質。看似簡單的兩句話,背後其實包含無數個實驗結果及推論,從基因序列到蛋白質結構與功能分析的過程中,需要不同領域的科學知識結合。

以熱力學為例:由序列預測蛋白質結構的第一步就是—能量平衡。穩定的蛋白質分子,在熱力學的描述中,就是達到自由能的最低點。分子在自由能最低點代表該分子僅需極少能量便能維持這樣的結構。搭配生物體使用能量的規則:消耗越少能量達到越大成效,我們就可以推論在自由能最低點時的構型,是最有可能在生物體中出現的結構。然而,這些推論往往伴隨著大量的資料分析及數據應用。利用電腦的運算力整合這些資料,我們便能用理論知識做為本體,連結不同的原理及數據,分析出我們想知道的答案。這就是計算生物的重要應用之一。

●蛋白質結構

蛋白質由多個氨基酸構成,根據親水性、極性等特性,摺疊成特別的形狀,可能因環境溫度改變構型,也可能在不同細胞中而有不同的功能。因此,許多生物體中的蛋白質其實是處於未知狀態,我們無法得知其結構及功能,甚至我們尚未發現它。

當前計算生物應用於蛋白質結構最知名的例子,就是由Google 開發出的 AlphaFold — 利用演算法解出蛋白質構型。AlphaFold 利用舊有的蛋白質結構原則,搭配神經網絡的分析技術,找出最適宜該段序列的方法,加以解出構型。因為有許多前人的智慧在其中,加上計算機的高速運算力,不僅可以節省時間,也可以找出最適合的方式做結構的預測。

AlphaFold的產生,可以從Protein Structure Prediction(CASP)這個競賽說起。CASP藉由競賽的方式,激發全世界對於蛋白質有興趣的科學家,共同研究並發展出更好的預測模型及方法。過去解出來的蛋白質結構,多半在晶體、高溫高壓或是特殊環境中形成,多半不符合人體內的蛋白質構型。然而,利用電腦模擬及計算,蛋白質的構形及變化,變得更容易呈現,也能較符合在生物體中的真實結構。

●藥物設計

計算生物不僅應用在基礎科學的研究上,解開基因密碼,知悉蛋白質結構。也可以應用在藥物設計上,促進人類福祉。目前的藥物設計,仍建構在大量的實驗中,或在偶然出錯的生物實驗裡發現。了解疾病機制後,需要先確認治療的目標,可能是一段基因,也可能是蛋白質上的某個片段;找出適合的蛋白質或化學分子,分析其結構及確認毒性;經過多次實驗後,找出適當的藥物分子。接下來就是進行臨床試驗及製造,臨床測試往往需要大量的生物做毒性測試及有效性測試,這些時間目前較難以縮短。然而,我們若應用計算生物學在藥物設計上,模擬不同的蛋白質及化學分子,找出藥物分子與致病原的互動機制,得知鍵結位置及結合率,達到更有效的藥物設計,甚至有機會設計新藥物,找到新的治療方法,便能縮短時間及減少測試耗費的金錢,加速藥物開發及幫助更多病人。

現在已經有數家外商公司,正利用計算生物的技術設計更好的藥物。例如:Antidote 公司利用病人的資訊做AI運算,輔佐藥物設計,加速研究腳步,以期許更快達到治療病人的目的;而Turbine 公司針對癌症的機制及標靶目標做模擬研究,找出新穎的藥物及準確的治療分子。這些公司看準計算生物的前景,利用不同的模擬運算能力,促進人類福祉,也幫助更多人。

計算生物不僅是人工智慧及機器學習的計算,也需要大量的分子生物知識及實驗測試,結合兩個領域的優勢,便能激起更多學術及醫療的火花。

 

--
本文整理自:108/11/23由朱智瑋老師在臺大思亮館國際會議廳所主講之「計算生物的見與思」演講內容。

人瀏覽過