機器人也能當科學家(1/3)

機器人也能當科學家(1/3)

撰文/Ross D. King|譯者/王怡文
轉載自《科學人》2011年5月第111期


重點提要

  • 有些科學問題太過複雜,若要設計並進行實驗來找出答案,需要科學家投入極多時間。
  • 機器人科學家可以填補這項人力空缺。雛形機「亞當」會擬定「酵母菌基因與其功能」的假說,設計檢驗假說的實驗,並進行實驗。
  • 亞當運用人工智慧、推理及機器設備,發現了酵母菌用以編譯特定酶的三個基因,是人類科學家尚未找到的基因。
  • 批評者認為亞當不能算科學家,因為它需要人類提供輸入和偶爾介入。但人類與機器人科學家合作,就能比任何一方單獨工作獲得更多的成果。

科學研究也能自動化嗎?我不是指自動化實驗,而是能夠探索科學新知的「機器人科學家」,可能嗎?我們就花了10年研發出一部。我們的主要動力有二。第一,是為了更了解科學。正如知名物理學家費曼(Richard Feynman)所言:「我無法創造的東西,就是我不了解的東西。」要打造機器人科學家,我們就必須考量抽象與實體對象間的關係、實驗與理論間的關係、各種擬定假說的方法,然後做出具體的工程決策。

第二個動機是現實面的:機器人科學家能提升研究生產力和成本效益。有些科學問題太複雜,需要大量研究,科學家人力不足,自動化是最佳解決方案。

科學界的電腦科技一直在進步,例如DNA定序和藥物篩檢等,都已做到「高產能」實驗室自動化;較不為人知的是,電腦也用在自動化資料分析,以及研擬初期的科學假說,例如在化學界,機器學習程式已用來協助設計藥物。機器人科學家的目標是結合這些技術,讓整個科學流程自動化:擬定假說、設計及進行實驗來檢驗假說、解讀結果,再重複上述流程直到發現新知識。

當然,終極問題是,我們真的能設計出機器人科學家,來實際完成整個流程嗎?我們實驗室設計出了兩部,世界各地也另有幾部機器人,它們的能耐給了我們肯定的答案。

讓亞當研究酵母菌

應用人工智慧從事科學探索的先鋒之作,出現在1960~70年代的美國史丹佛大學,他們設計了電腦程式DENDRAL來分析質譜儀資料,而Meta-DENDRAL程式則是最早的機器學習系統之一。研究者當時試圖研發一套自動化工具,打算在1975年美國航太總署(NASA)的維京任務中,尋找火星上的生命跡象,可惜當時的技術做不到。之後陸續出現了Prospector(用於地質學)、Bacon(用於一般探索)等程式,它們已經能自動提出假說並設計實驗,但大部份都無法自己實際做實驗,這代表人工智慧系統仍無法獨立(甚至半獨立)運作。

我們的機器人「亞當」長得並不像人,它是一座複雜的自動化實驗室,體積相當於辦公室的一個小隔間,具有一個冷凍櫃、三個液體處理裝置、三支機器手臂、三個培養箱、一部離心機等機件,都是自動化的。當然,亞當的大腦是一部威力強大的電腦,負責推理並控制硬體。

亞當的實驗是研究微生物的生長情形,它選擇菌株與培養基,幾天後再觀察這些菌株在培養基裡的生長情形。亞當全憑己力,在一天內配出約1000種菌株加培養基的組合。我們讓亞當去探索生物學裡一個很適合自動化的重要領域:功能基因組學,也就是探討基因與其功能的關係。

亞當第一個完整的研究和釀酒酵母(Saccharomyces cerevisiae)有關,這是製造麵包、啤酒和威士忌用的菌種。生物學家之所以對它感興趣,是因為它可當做「模式生物」,來探討人類細胞如何運作。酵母菌細胞裡的基因數量遠比人類細胞少,長得快又容易培養。儘管人類與酵母菌最後的共同祖先或許得回溯到10億年前,但演化很保守,適用於酵母菌的情形大部份也適用於人類細胞。

亞當鎖定的是一個未解的問題:酵母菌如何利用酶(催化特定生化反應的複雜蛋白質),將培養基變成更多酵母菌和代謝廢物。儘管科學家已研究了150年以上,知道酵母菌會產生許多種酶,但有些酶不知是由哪些基因編譯而成。而亞當就是要找出這些「孤兒酶」的「父母基因」。

為了獲得新發現,亞當需要大量的科學知識。我們在亞當的程式裡加入了大量的背景知識,包括酵母菌新陳代謝及功能基因組學。亞當擁有的是背景「知識」還是「資訊」,有待哲學辯論,但我們主張用「知識」這個詞,因為亞當用它來推理,並指引亞當和實體世界的互動。

亞當用邏輯陳述式來呈現知識。邏輯學發明於2400年前,它比自然語言更能精確地描述知識,而且,如果要讓機器人和人類交換知識時不產生歧義,用現代邏輯最精確。更方便的是,邏輯陳述式也能當做程式語言,因此亞當的背景知識可以轉譯成電腦程式。

我們編寫程式時,提供了許多事實(fact)。舉個典型的例子:釀酒酵母裡有個基因叫ARO3,它可以編譯出「3-去氧-D-阿拉伯庚酮糖酸-7-磷酸」(DAHP)的合成酶。我們也提供相關的資訊,例如這個酶能催化下述化學反應:「磷酸烯醇丙酮酸」(PEP)加「D-赤藻糖4-磷酸」,反應產生「2-去氫-3-去氧-7-磷酸-D-阿拉伯-庚酸」和磷酸。

綜合這些資訊,就能整合基因、酶及代謝產物(小分子),整理出酵母菌的新陳代謝模型。模型和知識庫有些不同,模型可以轉換成軟體,用來處理資料及預測結果。機器人科學家則可以整合抽象的科學模型和實驗室機器人學,自動化測試並改善模型。(待續)

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)

(Visited 1 times, 1 visits today)
views