AI 眼中的世界

2019 年 01 月 09 日2022 年 01 月 04 日 intern 感知, 深度學習, 當代藝術, 神經網路, 電腦視覺

分享至

編譯／台大電機系吳奕萱

電腦的視界

對演算法而言，這個世界呈現什麼樣貌？當機器在愈來愈多領域擁有決策力量時，其所「看到的世界」有什麼事物，便與我們的日常生活息息相關。舉例來說，若人臉偵測系統無法區別你的膚色，那可能會忽略這裡有你這個「人」存在；或者，更嚴重的情況，若自駕車無法偵測到前方有人，便可能直直開過去。

紐西蘭威靈頓維多利亞大學教授Tom White為運算設計（computational design）領域的著名學者。「運算設計」將電腦科學的思維套用在藝術設計上，運用演算法創作、分析，並形成互動式作品。「藉由神經網路創作瘋狂的畫作。」White在其個人網頁上這樣描述自己。

2017年底，White在印度新德里的「靜物畫廊」（Gallery Nature Morte）推出「ImageNet 的叛逆」（The Treachery of ImageNet）畫展。名稱結合了圖像識別資料庫「ImageNet」，以及比利時超現實主義畫家Rene Magritte的作品〈形象的叛逆〉（The Treachery of Images）（又名〈這不是一個菸斗〉，因其畫面上只有一個菸斗，但Magritte表示：畫上的只是一種象徵。）

創作素材包含電風扇、裁縫機與割草機等日常生活中常見的家電或機械，儘管對人類而言看似隨機排列的線條與色塊，缺乏明確的物品特徵與結構，然而在演算法眼中，卻都是一件件叫得出名稱的家用物品。

White的創作。由左至右分別以堆高機、尺與縫紉機為素材。（來源：T. White, 2018.）

感知引擎

White利用一稱作「感知引擎」（Perception Engines）的AI來創作，在看過多張已標記的物品影像後，將「腦中」學到的抽象概念化為實體圖像。其創作過程可分為三個部分：

繪圖系統（Drawing System）
將同一類別的物體影像，初步轉換為抽象線條與色塊。
表現評比（Creative Objective）
將上階段產出的草稿送入經ImageNet訓練後的神經網路評分，選出較能代表該類物品的作品。
規劃系統（Planning System）
根據上述評分，產生新的候選圖案與對應的向量表示，再送至繪圖系統進行下一個循環。

舉例來說，若要產生「電風扇」的抽象圖案，演算法會先由訓練資料集中學會辨識電風扇的特徵，接著產生充滿抽象線條與色塊的草稿，並測試此圖樣是否能強烈激發其他訓練好的演算法成功辨認該圖是一臺電風扇。若無法正確辨識，則反覆修改，直至達到一定程度的辨識成功率。

機器的視角 vs. 人腦的認知

AI眼中所見的大提琴（來源：T. White, 2018.）

機器辨别物體的方式，與我們相同嗎？仔細觀察這張代表大提琴的圖畫，在可以看出是大提琴的西洋梨狀形體背後，尾隨著另一個奇特的形體。這是因為模型接受訓練時，所接觸的大提琴圖像通常都有演奏家在其後。由此可知：模型對周遭環境的認識，來自訓練集中的圖像，有別於人類所具備的先驗知識能輕易區別「演奏家」與「樂器」是兩個不同的物件，這也是電腦視覺與人類認知最大的不同之處。

有些人認為White的作品是對人類的一種警示，揭露未來AI會如何徹底取代人類的角色與地位，包含那些屬於白領階級、需要創作力的職務。但對White而言，「只是嘗試忠實呈現演算法所看見的世界。」而即使是相同的事物，AI與人類卻有著截然不同的感觀與感受。

編譯來源

J. Vincent, “What algorithmic art can teach us about artificial intelligence“, The Verge, 2018.

參考資料

T. White, “Perception is all you need“, dribnet, 2018.
J. Sayers, “Computer Vision as a Public Act: On Digital Humanities and Algocracy – Disrupting the Digital Humanities“, Disrupting the Digital Humanities, 2016.

(本文由教育部補助｢AI報報─AI科普推廣計畫」執行團隊編譯)

(Visited 166 times, 2 visits today)

分享至

views