神經網絡也會腦補?

神經網絡也會腦補?

編譯/林采萱

格式塔現象

格式塔心理學最具體的實例:可從A、B、C、D圖中可以分別感知到三角形、方形、球形與直線。(圖片來源:Wikipedia)

20世紀初期,三位德國實驗心理學家開始對大腦如何接收外界刺激,並將其整理為有意義資訊的傳統說法產生質疑,因而發展出「格式塔心理學」(Gestalt psychology,或譯「完形心理學」),主張「整體並非僅僅是各組件的總和」。這概念看似抽象,卻能用來解釋許多令人匪解的人類認知現象。例如當我們看到右圖A,三個有缺口的圓形整齊排列,缺口分別對著圖像中心,我們的大腦很自然地就把三個缺口相連,腦補出一個正三角形的圖案,也就是著名的「格式塔現象」。顯示人類僅需零碎資訊,便可依據既有的經驗拼湊成完整圖像。在視覺設計領域中格式塔心理學被廣泛運用,藉由圖像的錯動、顏色的轉變,抑或是燈光快速切換形成視錯覺。

閉合律

長期以來,「人工智慧是否具備類似人類的認知能力」,一直是人們很感興趣的議題,只是苦於找不到一個有效的檢驗方法。然而神經網絡的架構便是模仿生物神經系統而來,尤其與靈長類動物的視覺皮質極為相近;而格式塔心理學最成功之處便在於解釋人類視覺認知,上述的格式塔現象即是其中閉合律(Law of Closure)的展現,具體且易於操作,提供了一個絕佳的實驗契機。

Google位在加州山景城(Mountain View)的人工智慧研究部門便針對「三角形錯覺」,設計出一個完整實驗。他們創建了三個圖像資料庫:第一個圖像資料庫由視覺上完整無缺的三角形組成;第二個圖像資料庫則僅勾勒出三角形的三個「角」,神經網絡必須「自行想像」,才有辦法「看見」完整的三角形;第三個圖像資料庫也是由類似「角」的圖案組成,但是彼此無規則地隨機排列,無法延伸、相連、構成完整三角形。

團隊先用第一個圖像資料庫訓練神經網絡識別正常、完整的三角形;再用第二個圖像資料庫測試神經網絡是否有能力與人類一樣,透過延伸與想像從中辨認出三角形、展現格式塔的閉合效應。第三個資料庫則作為對照組,確保神經網路不是單純看見「角」,便判定圖片中有「三角形」。

第二種圖像資料庫之圖形(左),角閉合後可形成三角形;第三種圖像資料庫之圖形(右),無法形成三角形。(圖片來源:Emerging Technology from the arXiv, 2019)

神經網絡與人類認知

除此之外,研究團隊還將訓練有素的神經網絡與未經訓練或經隨機數據訓練的網絡進行了比較,發現:相對於後兩者,經過訓練的神經網絡表現出與人類相似的格式塔現象,極可能與人類有著類似的視覺認知。

此研究將實驗心理學的應用範圍拓展,建立出一個新的試驗範本,可用以探討神經網絡的「心理現象」。未來更可能擴展到其他認知行為、比較人類與神經網絡的認知差異,甚至藉此建立起一個判斷神經網絡提取特徵或表現能力的基準。研究團隊認為,從這個全新的角度出發,有助於人類在往後創建出更強大的神經網絡。

 

編譯來源

Emerging Technology from the arXiv. “Trained neural nets perform much like humans on classic psychological tests“, MIT Technology Review, 2019.

參考資料

B. Kim, E. Reif, M. Wattenberg, and S. Bengio, “Do Neural Networks Show Gestalt Phenomena? An Exploration of the Law of Closure“, arXiv, 2019.

(本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯)

views