是與非以外的第三個選項

分享至

是與非以外的第三個選項

編譯/賴佳昀

從有到無

你可能想像不到,「虛無」或是「零」的概念,並非從數字被發明的時候就存在的。我們現在習以為常說「什麼都沒有呀!」,若是回到古希臘,甚至可能被列為不受歡迎的對象。巴比倫人最早提出「零」這一項發明,對數字系統來說有非常重大的意義,重視幾何學的希臘人不喜歡它,崇拜濕婆的印度人接受度卻十分良好,「零」甚至擁有了屬於自己的符號。一直到義大利數學家Fibonacci正式將「零」介紹給歐洲大陸,奠定了如今我們所熟悉的十進位制系統。但是,儘管我們現在可以熟悉、自在地使用零,在人工智慧領域裡,「什麼都沒有」卻依然遙不可及。

從無到有

以深度神經網路(Deep neural networks,DNN)這種監督式演算法為例,要模型學會如何達成一個任務──例如分辨蘋果和香蕉──人類就需要提供大量優質的圖片。一旦深度學習演算法搭配了質、量兼具的數據,那們它們的工作表現就可以得到高精準、低誤差,非常可信的評價。

但是問題在於:如果將第三種未知的東西,譬如說橘子,拿到DNN面前,問它這是啥?就這個神經網路而言,這個世界中就只有蘋果和香蕉,其他事物從來不曾出現在它的認知(受訓內容)中。神經網路被迫由兩者中做出選擇,即使這是一項完全不一樣的新類別。

「是」、「非」之外

那麼,如果我們加入「零」這個概念呢?在訓練或使用DNN的時候,會帶來什麼改變嗎?延續之前的例子,在訓練一個DNN時,在原本「蘋果」、「香蕉」兩類之外,新增「兩者皆非」這一個選項。當有物件不斷被DNN分類到「兩者皆非」的時候,研發人員就可能需要回過頭來考慮原先預設只有「蘋果」、「香蕉」的分類是否並不適當,是不是應該例如增加「橘子」這一個新的類別。

換個角度來想,當我們以外觀漂亮的蘋果和香蕉圖片來訓練DNN,這樣的一個神經網路在看到品質較差的水果圖像時,便會回答「都不是」,如此一來便可以用來當作檢測異常的手段,揪出不符合常態的數據。「終身DNN」(lifelong DNN)便是在這個概念底下發展而出,在演算法架構中納入了「無」的概念。

它透過回饋機制來比較新的數據符合或不符合之前所學習到的內容,這是個很類似人類的學習方式:生活中,我們潛意識地不斷檢查、確認我們對這個世界的認知。舉例來說,如果現在有人對你書房中椅子動了些手腳,悄悄地調高或調低椅子高度,我們馬上就會發現,這是因為在我們的腦中,有著與時俱進關於椅子高度的「模型」。一旦當下輸入的數據和這個模型不符,我們就能察覺到異常並提高警覺:也許有人侵入?老年痴呆症的早期徵兆?抑或者,一種全新、沒有人觀察到的自然現象?終身DNN的學習機制就是如此,在碰到與已知不符的輸入時,能「忠實地」呈現「什麼都不是」的答案。

讓我們現在來想想,在實際應用中若AI有了「空無」的概念能發揮什麼作用。以現今的製造業來說,機器承攬了產品生產的大部分工作。以品管的角度而言,若要使用傳統的電腦視覺系統來檢查產品是否有異常(像是是否有表面刮痕)相當困難,因為在已經上軌道的生產線上,良率很高,不良品很少而且狀況多變,這樣一來根本無法提供足夠的樣本來訓練電腦視覺系統。但對終身DNN而言,研發人員可以負面表列,用良品來訓練電腦視覺系統;一旦系統發現有產品無法被歸類至「良好」,則可以標示為異常,然後獨立出來區別處理,大幅降低了系統建置的時間與難度以及人力上不必要的浪費。

 

編譯來源

M. Versace, “The Next Frontier in AI: Nothing“, IEEE Spectrum: Technology, Engineering, and Science News, 2019.

參考資料

  1. N. Wallin, “The History of Zero | YaleGlobal Online“, Yaleglobal.yale.edu, 2002.
  2. 林宏軒、李肇棠、江滄明(民107年8月2日)。深度學習的訓練資料準備與平台之演進發展

(本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯)

(Visited 9 times, 1 visits today)

分享至
views