圖學與電腦視覺的耕耘者—專訪莊永裕

分享至

圖學與電腦視覺的耕耘者—專訪莊永裕

採訪/魏妤亘

逐步踏入人工智慧領域

當詢問起教授是如何接觸到人工智慧領域時,他輕笑著解釋道:「如果你兩年前問我是不是做AI的,我想,我不會回答我是做AI的。」

在莊永裕教授接觸到電腦視覺以前,其實是由圖學領域起家。大四時,因著修習歐陽明老師的電腦圖學課程,從三維建模、著色、成像的過程,漸趨發覺自身對圖像與多媒體的喜愛,於碩士期間也繼續以電腦圖學為研究主軸。真正開始接軌到電腦視覺,是因著去到美國就讀博士班,以計算攝影學為研究主題,透過這個介於電腦圖學與電腦視覺中間的領域,開啟了他學習電腦視覺的道路。

過去,狹義的人工智慧定義並不會特別把電腦視覺算進人工智慧的範疇,然而,以泛人工智慧的觀點來看,近年利用深度學習技術來發展的電腦視覺,其實也被包含在內。所謂的「泛人工智慧」,意指將模擬人類感官的電腦視覺、語音辨識、自然語言處理皆包含入人工智慧,是這一波人工智慧革命的主要興起領域。在這樣的狀況下,莊永裕教授才一腳踏入人工智慧領域。視覺對於人類與生俱來,要讓機器學會卻相當困難

在瞭解電腦視覺現今的發展之前,我們不妨先仔細思考看看,要發展電腦視覺時,我們首先要面對的問題會是甚麼?我們必須寫出規則讓機器能夠「看」東西。相較語覺,視覺是人類與生俱來的能力,我們從未教導孩子如何去「看」東西,在成長過程中,他們自然而然就學會了看見這個世界。由此,科學家們才驚覺,原來人類視覺的運作規則我們並不瞭解。

電腦視覺面對許多挑戰,比如說,相同物件在現實生活中可能擁有各式各樣不同的樣態。舉例來說,同樣是「貓」的圖片,不同姿態、不同顏色、不同亮度甚或不同種類的貓,該如何讓機器辨識出來?這些問題一直到2012年,深度學習技術有所突破,才讓電腦視覺領域也有了新的突破。

目前,影像辨識上,針對多元分類問題(例如:詢問電腦這張圖有沒有「樹」、「車」、「人」等物件),電腦已經可以做得相當好。而在命令電腦進行影像切割上(例如:要求電腦從圖片中切割出車子),也已經有了不錯的成果。

這一波人工智慧革命的界限與發展

對於電腦視覺上的突破,莊永裕教授表示,這已經是很大的突破,但因著深度學習的技術,我們再度面臨不同的挑戰。目前,深度學習技術仍猶如黑盒子,即使看見了更好的結果,但卻無法解釋促使這個技術成功的法則。侷限的「可解釋性」,讓產品的商品化遇到了難關。一般的上市商品,法規上可能會對於可解釋性有所要求,必須要能夠解釋其做決策的依據、規則以及順序,但這卻是目前深度學習技術還無法做到的。

舉例來說,目前電腦視覺的其中一個重要應用為「無人駕駛車」,它現在面臨最大的問題或許並非技術上的問題,而是倫理與法律的問題。假設無人駕駛車在行駛當中遇到以下情境:急轉彎能夠避免撞上眼前的小朋友,卻會撞上安全島危及車上的駕駛;繼續直行會撞上眼前的小朋友,卻能保全駕駛的安全。無人駕駛車應該做哪個決定?對人來說,這瞬間的時間可能並不足以讓人腦經歷嚴密推理,但當車子的控制來自於演算法,這個演算法會依據甚麼規則決定選擇?

另外,針對這一波人工智慧革命,教授也提出了他的見解。這次的革命,確實使機器在人類感知模擬上有不錯的成效,然而,再往上的「推理、創造」等,教授則是採取保留態度,認為目前尚未看見可能性。

人工智慧在台灣

在台灣,這一波人工智慧革命相較於以往,不只是有由上而下的政策推動,更由下而上由產業提出許多殷切的需求與期待。公部門的科技部、經濟部、教育部皆推出了相應的企劃,並且,不只資通訊領域,傳統製造領域、零售業等私人企業也在進行影響評估與反思。有許多人疑惑這一波的人工智慧是否又會成為「泡沫」?莊永裕教授認為,即便或許不如大家原先期待的那樣好,但是它已經為人類生活及產業帶來眾多具體改變。相對於中國、美國,台灣擁有的資源與人力較為有限,如何做出與他人有區隔,尋找到自己的路,是台灣最大的挑戰。

不只談專業,已擁有家庭與小孩的教授在訪談最後,笑著分享了自己工作以外的生活。照顧與陪伴孩子、看看體育賽事、利用搭公車時間閱讀電子書,這些看似普通的興趣,持續點綴著他的生活。這次的訪談,在輕鬆中畫下句點,我們期待在「電腦視覺」的道路上,繼續跟著莊永裕教授挖掘寶藏。

(本文為教育部「人工智慧技術及應用人才培育計畫」成果內容)

(Visited 47 times, 1 visits today)

分享至
views