是與非以外的第三個選項

2020 年 07 月 29 日2021 年 12 月 27 日 intern 品管, 良率, 零

分享至

編譯／賴佳昀

從有到無

你可能想像不到，「虛無」或是「零」的概念，並非從數字被發明的時候就存在的。我們現在習以為常說「什麼都沒有呀！」，若是回到古希臘，甚至可能被列為不受歡迎的對象。巴比倫人最早提出「零」這一項發明，對數字系統來說有非常重大的意義，重視幾何學的希臘人不喜歡它，崇拜濕婆的印度人接受度卻十分良好，「零」甚至擁有了屬於自己的符號。一直到義大利數學家Fibonacci正式將「零」介紹給歐洲大陸，奠定了如今我們所熟悉的十進位制系統。但是，儘管我們現在可以熟悉、自在地使用零，在人工智慧領域裡，「什麼都沒有」卻依然遙不可及。

從無到有

以深度神經網路（Deep neural networks，DNN）這種監督式演算法為例，要模型學會如何達成一個任務──例如分辨蘋果和香蕉──人類就需要提供大量優質的圖片。一旦深度學習演算法搭配了質、量兼具的數據，那們它們的工作表現就可以得到高精準、低誤差，非常可信的評價。

但是問題在於：如果將第三種未知的東西，譬如說橘子，拿到DNN面前，問它這是啥？就這個神經網路而言，這個世界中就只有蘋果和香蕉，其他事物從來不曾出現在它的認知（受訓內容）中。神經網路被迫由兩者中做出選擇，即使這是一項完全不一樣的新類別。

「是」、「非」之外

那麼，如果我們加入「零」這個概念呢？在訓練或使用DNN的時候，會帶來什麼改變嗎？延續之前的例子，在訓練一個DNN時，在原本「蘋果」、「香蕉」兩類之外，新增「兩者皆非」這一個選項。當有物件不斷被DNN分類到「兩者皆非」的時候，研發人員就可能需要回過頭來考慮原先預設只有「蘋果」、「香蕉」的分類是否並不適當，是不是應該例如增加「橘子」這一個新的類別。

換個角度來想，當我們以外觀漂亮的蘋果和香蕉圖片來訓練DNN，這樣的一個神經網路在看到品質較差的水果圖像時，便會回答「都不是」，如此一來便可以用來當作檢測異常的手段，揪出不符合常態的數據。「終身DNN」（lifelong DNN）便是在這個概念底下發展而出，在演算法架構中納入了「無」的概念。

它透過回饋機制來比較新的數據符合或不符合之前所學習到的內容，這是個很類似人類的學習方式：生活中，我們潛意識地不斷檢查、確認我們對這個世界的認知。舉例來說，如果現在有人對你書房中椅子動了些手腳，悄悄地調高或調低椅子高度，我們馬上就會發現，這是因為在我們的腦中，有著與時俱進關於椅子高度的「模型」。一旦當下輸入的數據和這個模型不符，我們就能察覺到異常並提高警覺：也許有人侵入？老年痴呆症的早期徵兆？抑或者，一種全新、沒有人觀察到的自然現象？終身DNN的學習機制就是如此，在碰到與已知不符的輸入時，能「忠實地」呈現「什麼都不是」的答案。

讓我們現在來想想，在實際應用中若AI有了「空無」的概念能發揮什麼作用。以現今的製造業來說，機器承攬了產品生產的大部分工作。以品管的角度而言，若要使用傳統的電腦視覺系統來檢查產品是否有異常（像是是否有表面刮痕）相當困難，因為在已經上軌道的生產線上，良率很高，不良品很少而且狀況多變，這樣一來根本無法提供足夠的樣本來訓練電腦視覺系統。但對終身DNN而言，研發人員可以負面表列，用良品來訓練電腦視覺系統；一旦系統發現有產品無法被歸類至「良好」，則可以標示為異常，然後獨立出來區別處理，大幅降低了系統建置的時間與難度以及人力上不必要的浪費。

編譯來源

M. Versace, “The Next Frontier in AI: Nothing“, IEEE Spectrum: Technology, Engineering, and Science News, 2019.

參考資料

N. Wallin, “The History of Zero | YaleGlobal Online“, Yaleglobal.yale.edu, 2002.
林宏軒、李肇棠、江滄明（民107年8月2日）。深度學習的訓練資料準備與平台之演進發展。

(本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯)

(Visited 75 times, 1 visits today)

分享至

views