【人物專訪】圖學與電腦視覺的耕耘者——專訪莊永裕

2018 年 11 月 19 日2018 年 11 月 20 日 CASE PRESS 人工智慧, 莊永裕

分享至

●12/1 莊永裕老師主講：「矽眼—電腦視覺初探」點此報名！

採訪、撰文｜魏妤亘

因著擁有視覺，人類得以看見美麗奧妙的萬物，由此感到驚嘆與悸動。視覺於乎人類，使用地如此自然，但機器也能夠輕易擁有視覺感受嗎？藉由來到資工系，與長期耕耘於電腦圖學與電腦視覺的莊永裕教授對談，讓我們一窺這奧秘。

●逐步踏入人工智慧領域

當詢問起教授是如何接觸到人工智慧領域時，他輕笑著解釋道：「如果你兩年前問我是不是做AI的，我想，我不會回答我是做AI的。」

在莊永裕教授接觸到電腦視覺以前，其實是由圖學領域起家。大四時，因著修習歐陽明老師的電腦圖學課程，從三維建模、著色、成像的過程，漸趨發覺自身對圖像與多媒體的喜愛，於碩士期間也繼續以電腦圖學為研究主軸。真正開始接軌到電腦視覺，是因著去到美國就讀博士班，以計算攝影學為研究主題，透過這個介於電腦圖學與電腦視覺中間的領域，開啟了他學習電腦視覺的道路。

過去，狹義的人工智慧定義並不會特別把電腦視覺算進人工智慧的範疇，然而，以泛人工智慧的觀點來看，近年利用深度學習技術來發展的電腦視覺，其實也被包含在內。所謂的「泛人工智慧」，意指將模擬人類感官的電腦視覺、語音辨識、自然語言處理皆包含入人工智慧，是這一波人工智慧革命的主要興起領域。在這樣的狀況下，莊永裕教授才一腳踏入人工智慧領域。

●視覺對於人類與生俱來，要讓機器學會卻相當困難

在瞭解電腦視覺現今的發展之前，我們不妨先仔細思考看看，要發展電腦視覺時，我們首先要面對的問題會是甚麼？我們必須寫出規則讓機器能夠「看」東西。相較語覺，視覺是人類與生俱來的能力，我們從未教導孩子如何去「看」東西，在成長過程中，他們自然而然就學會了看見這個世界。由此，科學家們才驚覺，原來人類視覺的運作規則我們並不瞭解。

電腦視覺面對許多挑戰，比如說，相同物件在現實生活中可能擁有各式各樣不同的樣態。舉例來說，同樣是「貓」的圖片，不同姿態、不同顏色、不同亮度甚或不同種類的貓，該如何讓機器辨識出來？這些問題一直到2012年，深度學習技術有所突破，才讓電腦視覺領域也有了新的突破。

目前，影像辨識上，針對多元分類問題（例如：詢問電腦這張圖有沒有「樹」、「車」、「人」等物件），電腦已經可以做得相當好。而在命令電腦進行影像切割上（例如：要求電腦從圖片中切割出車子），也已經有了不錯的成果。

●這一波人工智慧革命的界限與發展

對於電腦視覺上的突破，莊永裕教授表示，這已經是很大的突破，但因著深度學習的技術，我們再度面臨不同的挑戰。目前，深度學習技術仍猶如黑盒子，即使看見了更好的結果，但卻無法解釋促使這個技術成功的法則。侷限的「可解釋性」，讓產品的商品化遇到了難關。一般的上市商品，法規上可能會對於可解釋性有所要求，必須要能夠解釋其做決策的依據、規則以及順序，但這卻是目前深度學習技術還無法做到的。

舉例來說，目前電腦視覺的其中一個重要應用為「無人駕駛車」，它現在面臨最大的問題或許並非技術上的問題，而是倫理與法律的問題。假設無人駕駛車在行駛當中遇到以下情境：急轉彎能夠避免撞上眼前的小朋友，卻會撞上安全島危及車上的駕駛；繼續直行會撞上眼前的小朋友，卻能保全駕駛的安全。無人駕駛車應該做哪個決定？對人來說，這瞬間的時間可能並不足以讓人腦經歷嚴密推理，但當車子的控制來自於演算法，這個演算法會依據甚麼規則決定選擇？

另外，針對這一波人工智慧革命，教授也提出了他的見解。這次的革命，確實使機器在人類感知模擬上有不錯的成效，然而，再往上的「推理、創造」等，教授則是採取保留態度，認為目前尚未看見可能性。

●人工智慧在台灣

在台灣，這一波人工智慧革命相較於以往，不只是有由上而下的政策推動，更由下而上由產業提出許多殷切的需求與期待。公部門的科技部、經濟部、教育部皆推出了相應的企劃，並且，不只資通訊領域，傳統製造領域、零售業等私人企業也在進行影響評估與反思。有許多人疑惑這一波的人工智慧是否又會成為「泡沫」？莊永裕教授認為，即便或許不如大家原先期待的那樣好，但是它已經為人類生活及產業帶來眾多具體改變。相對於中國、美國，台灣擁有的資源與人力較為有限，如何做出與他人有區隔，尋找到自己的路，是台灣最大的挑戰。

不只談專業，已擁有家庭與小孩的教授在訪談最後，笑著分享了自己工作以外的生活。照顧與陪伴孩子、看看體育賽事、利用搭公車時間閱讀電子書，這些看似普通的興趣，持續點綴著他的生活。這次的訪談，在輕鬆中畫下句點，我們期待在「電腦視覺」的道路上，繼續跟著莊永裕教授挖掘寶藏。

●12/1 莊永裕老師主講：「矽眼—電腦視覺初探」點此報名！

(Visited 214 times, 3 visits today)

分享至

views