人機共處的新世界(2/2)
撰文/翁千婷|轉載自《科學人》2016年7月第173期
學術界的挑戰
與業界不同,人工智慧研究人員追求的目標,在於找出人可以做、機器不能做的事情,並讓機器可以做到。
林玉柱說:「人工智慧與機器人學的發展中遭遇一個現象,稱為『莫拉維克弔詭』(Moravec’s paradox),就是人類認定的高等智慧能力(例如推論)只需要很少的計算就可以完成;而幼兒就能完成的事情,例如到處爬、辨識物品、學習語言、把玩具拿起來丟人,要在機器上實現卻非常困難。」
以讓深度學習在學界奠定地位的大規模視覺辨識競賽(Large Scale Visual Recognition Challenge,ILSVRC)來說,就算是系統配備了高速圖形處理器(GPU),要看超過120萬張事先用人工標示好類別的圖片、建出分類影像的模型,也得花上一個星期的時間。
2012年,吳恩達帶領的Google Brain深度學習系統計畫,從YouTube影片中擷取了1000萬張沒有標示類別的圖片輸入給Google Brain,三天後系統可以自行把圖片分類成人臉、人體、貓。Google Cultural Institute計畫的系統更進一步到把700萬張藝術收藏品,分成4174個類別。林守德解釋,在深度學習以前,機器視覺的做法是從圖片的像素找出特徵,把特徵放進系統加以訓練並建出模型,之後由模型去分類影像,但是深度學習不需要這個步驟,就會自己找出特徵並分類影像。
換句話說,深度學習演算法造就機器學習速度與效率上的突破,讓某些過去認為人類可以做、但是機器做不到或做得很差的事情,現在不但機器可以做,而且做得比人類更好了。
人工智慧研究社群一方面探索深度學習可以應用的層面與限制,同時也繼續開發其他學習方法,甚至挑戰更多人類不能做的事情。
在機器學習應用的部份,研究人員與不同領域的專家合作,把特定領域的資料輸入到深度學習模型裡,讓系統從資料中找出特徵或規則。林守德表示,機器學習與不同領域專家的合作是在前期,也就是把資料輸入電腦之前的這段期間。林守德的團隊與法律學者合作,希望讓系統可以讀懂判決書進而自行產生判決結果,這時就會需要法律專業上的協助,標出判決書中重要的內容,以便從文本中擷取有助於產生判決的知識。
深度學習模型擅長從抽象底層的資料中擷取出有用的特徵,在搜尋範圍小、輸入的資料本身對人類而言較難判讀的領域中表現得特別好,例如影像、圖片、聲音,其基本組成元素是比較底層的像素或是聲波。但是當資料本身具有特定意義,要系統再去擷取出抽象意義,效果就不一定會好。林守德的團隊曾經想要利用電腦判斷某些研究計畫的申請是否會被接受,他們輸入了研究計畫的內容、計畫申請者的背景與研究記錄等,發現利用深度學習系統來學習這樣的判定,結果並不會比利用一般機器學習的方法好。
開發出自然注音輸入法、長期鑽研自然語言處理的許聞廉直言,所有的統計式機器學習模式都有個共同缺點,就是出錯的時候沒有辦法解釋。他說:「我們認為是語意的運算,在統計模型都變成了參數的運算。統計式模型在學習過程是調整參數。用白話講,我們訓練了一個辨識狗的模型,如果輸入一張狗的照片,機器認不出來,統計式模型無法告訴我們為什麼機器認得出其他照片裡的狗,卻認不出這張照片裡的狗。AlphaGo下棋很厲害,但它靠的是從無數高手下的棋譜中統計出勝率,而不能像圍棋高手一樣說出自己為什麼要這樣下。」他理想中的機器不是光會做一個題目,而是要能夠教人怎麼做。
美麗新世界
在許聞廉看來,電腦的計算能力雖然早已遠遠超過人腦,卻因為看不懂文字題目,連小學的數學應用題都算不出來。他目前最主要的研究方向是讓電腦可以幫人讀書,因為研究工作要讀很多新的研究論文,人自己讀這些文章要很久,機器雖然可以讀得很快,但是理解得不好。領導Google人工智慧研究的詹南德雷亞(John Giannandrea),在回答《麻省理工科技評論》(MIT Techonology Review)舊金山分部主編西蒙奈特(Tom Simonite)詢問「如果現在是人工智慧的春天,那人工智慧的夏天何時到來?」時,也給出類似的回答。他認為,機器翻譯是把一個句子用另一種語言表達出來,但機器理解是機器能夠讀進一個句子,用同樣的語言換個方式說出來,要等到那個時候,才有可能說是人工智慧的夏天到來。
林守德也不諱言,深度學習雖然在機器視覺上大勝以往的學習方法,但是在機器翻譯等自然語言處理上,以深度學習為基礎的系統,仍比不過以往機器翻譯提出的最佳方法。這幾年來,研究學者也在思考怎麼把人類的知識建入機器學習系統裡,如果能夠在統計為主的方法上,放進去相對應的知識,便有機會突破統計式學習的瓶頸。
對於人工智慧研究的未來,林守德跳脫人腦與電腦的比較,認為人工智慧在未來最大的貢獻,不是模仿人類可以做到的事,而是做出人類做不到的事情。例如:發現新元素、合成新藥、快速交易等,這些是人的智慧做不到的事。他研究的方向不是機器學習,而是機器發明:讓電腦能夠發現人類還沒有發現的新東西,例如破解密碼、從社群網路偵測人與人之間的關係、找出恐怖份子等。這並不是讓電腦學習,而是應用電腦的計算能力與記憶能力,做出超越人類智力可及的工作。他相信唯有解放人工智慧,讓人工智慧不再局限於模擬或追趕人類智慧,人工智慧方能達到新的境界。
會讀書、考試、寫作、合成新藥的機器人―科學家的目標彷彿又把我們帶回科幻的機器人世界。然而也就是這樣不放棄探索的決心與毅力,讓辛頓與其研究同仁,以及無數科學研究工作者可以熬過研究長期不見進展的低谷,終於創造出革命性的突破。(完)
(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)