科學家必看!AI正在改變科學研究的方式

編譯|陳奕廷

你是否覺得在新聞、臉書、廣告和你的朋友都在討論人工智慧、深度學習和大數據?沒錯!因為它們就是這麼重要!人工智慧除了應用在「傳統人工智慧領域」,他也席捲了直覺上跟人工智慧毫不相干的許多科學領域。包括尋找新的基本粒子、憂鬱程度的預測、從書寫風格判斷個性、古文鑑定、找出自閉症根源、去除天文雜訊和研發製藥,這些都和AI有關。讓我為你一一介紹!

●粒子,粒子,你是誰?

為了瞭解宇宙是怎麼運作的,粒子物理家研究次原子粒子加速碰撞後產生的奇特物質。例如:2012年在瑞士的大強子對撞機中,科學家發現了長期尋覓的「希格斯粒子」。這個粒子能解釋為什麼其他粒子會有質量。

在加速器對撞實驗中,粒子不會主動告訴我們它們的身分,光看數據無法直接得知它們是哪種粒子。希格斯粒子只有在每十億次質子碰撞中才會產生一次,產生後僅在十億分之一皮秒內就衰變成光子、緲子等其他粒子。為了確認希格斯粒子的存在,物理學家需要追蹤所有其他粒子的分佈,回推它們是否源自於同一個衰變過程。分析過中牽扯到多種粒子的大批數據,使希格斯粒子比一般粒子物理實驗還要難分析。機器學習法可以透過關聯性分析找出不同種類粒子碰撞的微小差異,分辨某些產物究竟是源自於希格斯衰變或是其他的過程。找出這些過程的微妙不同,就像是所謂的大海撈針一樣,這也是為什麼需要人工智慧的幫忙。2024年,科學家計畫將大強子對撞機升級,並讓粒子碰撞頻率提升10倍。面對海量的資料,以AI和機器學習法為基礎的分析方法會越來越重要。

利用人工神經網路,科學家從大強子對裝機(LHC)中粒子對撞的殘骸中尋找新粒子的蹤影。

●你不用說,我都知道!

每一年,社群網站中上億個用戶和億萬次的社交推文為社會科學提供了極大的數據庫,這也為AI開啟了前所未見的機會。美國賓州大學心理學家Martin Seligman順著這個趨勢,從社交大數據中分析大眾的情緒和身體健康狀況。傳統情緒和健康資訊通常是透過問卷調查方式進行的。但Seligman認為比起問卷,透過分析社交資料更經濟且不打擾到分析對象,而且效果更好。在最近一項研究中,他分析臉書中29000個用戶對於憂鬱情緒自我評估,他的演算法可以找出文字內容和憂鬱程度的關聯性。

在另外一項研究中,美國德州大學奧斯丁分校心理學家James Pennebaker除了分析文字內容,還著重於文字風格。例如:在美國大學的申請入學論文中,學生使用虛詞(連接詞、副詞等)的方式可以用來預測學生的成績。冠詞和介詞的使用代表批判性思考能力和優異成績。代名詞和副詞的使用代表敘事性思考和較差的成績。在另一個例子中,他的研究顯示1728年的劇本《雙重騙局》確實是莎士比亞親手寫的。這個劇本的真實作者身分仍廣受爭議,James Pennebaker透過機器學習法,分析出劇本中的認知複雜度與稀有字詞使用和莎士比亞其他作品相符

●AI找尋自閉症的根源

在基因學中,自閉症是讓科學家苦惱的問題。遺傳資料顯示自閉症有一段非常顯著的基因,但目前研究的基因變量僅能解釋20%的情況。要找出剩下的變量,科學家必須分析兩萬五千個其他基因以及其相關的DNA,這是人類難以駕馭的資料規模。因此,美國普林斯頓大學的計算生物學家Olga Troyanskaya和位於紐約市的賽門基金會採用AI來研究這個問題。他結合數百筆資料,包含在特地的人類細胞中活躍的基因種類、蛋白質如何互動、轉譯因子結合位置和其他基因組特徵的位置。透過機器學習,他的團隊更清楚地了解基因間的交互作用,並找出其他2500個自閉症潛在相關的基因組。

除了基因密碼之外, DNA所處的環境也大大的影響基因的行為。比起找出導致自閉症的基因組,分析這些環境因子是一個更艱難的任務,而Troyanskaya也用AI嘗試解決這個問題。他們開發一個深度學習系統「DeepSEA」,計算自閉症患者的基因組資料並分析這些環境因子的重要性。這項研究被認為是「將深度學習應用於基因學的里程碑」。

AI幫助我們尋找上千種可能會導致自閉症的基因。

●讓我們更了解星空的人工智慧

今年四月,天文物理學家Kevin Schawinski在推特上發了一些模糊的星系照片和一個問題:「請問有天文學家朋友能幫我分類這些星系嗎?」他的一些朋友推文說照片像是橢圓和螺旋星系等常見的星系型態。事實上,這些圖片是AI透過「生成式對抗網路(GAN)」合成的。更有趣的是,圖片製作過程完全沒有包含任何物理學知識。GAN是機器學習法的一種,它讓兩組人工神經網路互相對抗,一個負責製造圖片,一個負責分析圖片裡面的偽造缺陷,迫使生成網路製造更逼真的圖片。Schawinski的目標是透過這項科技,將一個模糊的望遠鏡影像處理成比原始檔還要好的照片。這樣的技術讓天文學家可以從觀測中獲得更多的細節。

將機器學習在天文學中的應用中,這並不是唯一的例子。美國費米國家實驗室天文物理學家Brian Nord用機器學習法來分析強重力透鏡。重力透鏡是一種光線因為彎曲的時空而曲折的現象。它可以用來定義宇宙物體間的距離,並且幫助發現之前沒有觀測過的天體。強重力透鏡在視覺上非常顯而易見,但在數學上非常難以分析。傳統電腦難以分辨重力透鏡,但人眼卻可以輕易辦到。Nord和他同事發現經過上千張照片訓練過的人工神經網路可以和人眼一樣可以判斷出重力透鏡。

一個熟知星系長相的AI可以幫助我們把模糊的影像(左)變得清晰(右)。

●人工神經網路學習烹飪化學

就像一個大廚,總是先想好最終餐點應該要長什麼樣子,才構思如何烹飪。許多化學家先想好化學產物的分子結構,才構思如何合成它們。但這比烹飪還難上很多,必須要從上百種潛在的原料和上千種連結這些原料的化學反應條件中做出選擇。數十年來,化學家費盡苦心的將已知的化學反應寫入電腦,希望可以建立一個程式告訴科學家合成目標產物最簡單的方式。然而化學是非常微妙的,很難將所有的條件寫成程式碼。

德國明斯特大學Marwin Segler希望AI可以引導他們突破合成分子的關鍵。他們不直接將化學反應的規則寫進程式碼,而是設計一個深度學習系統,能學習化學反應是如何進行的。給他的數據越多,他表現得更好。隨著訓練時間增加,這個深度學習系統能預測合成目標產物的最佳方法。在一場測試中,他們用40種目標物比較他們的程式和其他傳統的程式。傳統的程式在兩個小時內找出22.5%的合成方法,而他們的程式在相同的時間找出95%。Segler將帶著這項技術進入藥廠,改善並加速藥物的製造流程。

 

編譯來源:AI is changing how we do science. Get a glimpse, Science Technology (2017)

 

加入好友

4,779 人瀏覽過