不是所有的預測都一樣 來自相對論的啟示

不是所有的預測都一樣 來自相對論的啟示

編譯/賴佳昀

因果關係比想像中來得重要

這一秒將要發生的事情(果),都源自於上一秒已存在的現實(因),我們之所以能相當熟練地串起兩件事件、正確猜測等一下會發生什麼,是因為我們對因果關係的直覺很強大。從呱呱墜地的那一天起,我們便不斷地觀察這個世界的運行方式,然後透過已經歷百萬年演化淬鍊的大腦,本能地處理這些觀察到的資訊。不過對於電腦而言,找出因果關係卻不是一件容易的事。

機器學習模型能夠很快地找出一堆資料彼此的相關性,但卻無法解釋為什麼A事件是發生在B事件之後,而不是之前。這會有怎麼樣的後果呢?以疾病診斷為例,一個疾病通常會與病患顯現出來的多種症狀有關,例如第二型糖尿病患者往往有體重過重、呼吸急促的問題;但反過來看,呼吸急促並不是因為糖尿病引起的,若使用胰島素來治療患者,並無法有效改善這項症狀。

如何教會機器分辨哪些事件是因?哪些是果?目前的方法大多是以一個連續動作為資料,讓電腦一幀一幀地找出其中事件的發生模式,進而推測未來最有可能的發展。例如,讓模型觀看一列火車駛出車站的影像,然後要求它預測接下來的影像該是如何。這個方法,在最初幾幀預測影像中的表現不錯,但在約五到十幀後,模型的預測準確性卻急速下降。因為AI所預測的每一幀影像,其實都是在前一幀影像的基礎上生成的。隨著幀數越來越多,最初幾幀影像中的小瑕疵便會被不斷放大,最終毀了後續的預測影像。倫敦帝國學院的研究員Vlontzos與同事,於是受到愛因斯坦狹義相對論中光錐(light cone)的啟發,提出了一種更好的方法。

不是所有的預測都一樣

(圖片來源:K. Aainsqatsi/en.wikipedia)

所謂光錐,是在愛因斯坦的狹義相對論中能夠影響一事件的因果範圍。如果拿一張白紙,在上面畫上一個黑點代表一個事件,然後以這個黑點為中心畫個圓。這個圓的半徑,就是光在一定時間內走過的距離。由於這個世界上沒有任何東西(包含資訊)的傳播速度可以超過光速,所以這個圓就是能夠影響或被該事件(圓心)影響的因果邊界。原則上,在圓內任何一處所發生的事件,都可能影響圓心事件或受圓心事件影響,圓外則不可能與圓心事件有任何關連。隨著時間流逝(t+n),這個圓的半徑也會變大,代表圓心事件有更多發展的可能。Vlontzos等人就是以這個概念來限制模型可能給出的預測。

他們用了兩組數據來測試這個想法:一組是在螢幕上不斷移動的手寫數字,另一組則是正在走路或揮動手臂的人。在訓練時,這些影像不會按順序排序,而是在生成與訓練影像相似的內容後,AI必須學習在光錐演算法所給出的限制範圍中選出最有可能的下一幀影像。例如,前一秒是一位短頭髮、穿著襯衫的人在走路,那麼AI就不應該選擇一個長頭髮或不是穿襯衫的人作為下一幀影像。任何生成模型都可適用這種方法,只要另外加上光椎演算法即可。

實驗中,光錐的半徑是由人工定義的,但Vlontzos等人不諱言或許讓AI來做決定會是更好的選擇。舉個例子:在足球場上踢出一顆球,這顆球在未來可能出現的位置比沿著軌道滑動的球還多元。這樣一來,足球場中的球就該有更大的光錐半徑,以包含未來更多的可能性。

更準確的AI預測

在現實生活中,我們做出決定或採取行動時,往往都是已經掌握了某種因果關係,謀定而後動,方能事半功倍。因果關係觸及了事情將如何發展的核心,其重要性是單純的相關性(correlation)所無法取代的。同樣的道理,也適用於現在許多AI應用。

以自動駕駛車輛為例,車載AI系統需要能夠判斷路旁的小孩是否會突然跑到馬路上,或是前面那台腳踏車是否停得太出來而構成危險。在醫藥方面,AI可以用來模擬病患對特定治療藥物的反應,供醫護人員判斷哪種治療方案較為合適。或是透過醫療影像,AI可以給出疾病未來的可能發展。這一切,端看AI能否精準地預測未來。

 

編譯來源

W. Heaven, “How special relativity can help AI predict the future“, MIT Technology Review, 2020.

參考資料

  1. W. Heaven, “Google’s medical AI was super accurate in a lab. Real life was a different story.“, MIT Technology Review, 2020.
  2. W. Heaven, “An algorithm that can spot cause and effect could supercharge medical AI“, MIT Technology Review, 2020.

(本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯)

views