從電腦視覺到機器學習 Appier 首席科學家——專訪孫民
採訪/林麗珊
年僅 35 歲就成為 Appier 首席科學家,同時在清華大學電機工程學系擔任副教授的孫民,是橫跨學術界與商業界的頂尖AI人才,他擅長使用深入淺出的語言解釋艱澀複雜的技術,因緣際會師承AI界兩大專家的孫民,從 2007 年進入電腦視覺領域,又在 2012迎來深度學習的大爆發,就此改變了後來發展的方向。他試圖在研究的路上叩問 AI 發展的重要問題,也在 AI 商用落地的關鍵時刻,投身企業,為台灣第一家獨角獸新創打造更好的服務。一路走來始終站在趨勢的浪頭,孫民跟隨自己內心的聲音投入任何一項挑戰。
2005 年孫民前往史丹佛大學就讀電機系碩士班,主攻電路設計,他說道「我當時去修一些偏硬體的課的時候,發現班上幾乎都是台灣、印度、韓國的同學,因此好奇其他美國同學都修了什麼樣的課,就這樣誤打誤撞地踏入從前未曾接觸過的領域——吳恩達老師教授的機器學習課。」機器學習是一個在各領域萬用的工具,只要給他數據與訓練目標,就有許多不同的演算法可以組合,這打開了孫民的靈感與好奇,他想像自己可以將這個工具應用在很多不同領域,發揮空間很大,因此決定朝這領域攻讀。
孫民在吳恩達老師的啟蒙下,以優異的成績進入老師的實驗室擔任研究助理,在此獲得許多論文發表的機會並成功轉入機器學習的領域。電腦視覺專家李飛飛老師則是孫民在博士生涯決定研究取向的關鍵人物。2007 年孫民到普林斯頓就讀 PhD,適逢李飛飛老師正在構想一個資料庫—— ImageNet,ImageNet是一個大型視覺資料庫,用於視覺目標辨識軟體研究,目標蒐集上千萬張網路圖片,標註其中幾十萬種物件進行機器學習訓練,教電腦學習辨識巨量的圖像資料。這項研究也是促成 2012 年深度學習技術大突破,AI 應用重新被熱議的重要基礎。「這是一個吃力不討好的工作,但她成功了,也帶動整個產業的發展。」孫民說,因此備受鼓舞的孫民還記得當年恩師李飛飛對他說的話「要做就要做大的,過程中不要害怕別人的評價。」
「即使在一個偏向應用的領域,李飛飛老師仍然會問非常有挑戰性的大問題,她認為,一個研究人員就是應該要處理這種劃時代的重要問題。」孫民回台前曾徵詢她對自己教學與研究生涯有沒有什麼建議,想不到李飛飛老師竟回答:「我給你的建議就是不要聽從前輩的建議。」這樣的觀念也讓孫民回台教書後更強調學生的主動性,他認為「一個 young student, young researcher,你要敢於 make your own decision, be responsible to what you think is important,重點是能不能說服自己!」
在往後的研究中,孫民也更傾向研究基礎卻重要的問題,其中一項神經網絡架構搜索 (Neural Architecture Search) 簡單來說就是使用一個 AI 訓練另一個 AI,他必須設計機器學習演算法,自己調教、演化,讓人工神經網絡處理越來越複雜的問題,找到更好的解決方案,讓預測能力越來越好。「當你資料越來越多,模型越來越複雜,很難用人腦設計,就需要仰賴另一個 AI 去設計。」
為自己的選擇負責、跟隨自己內心的聲音,也是孫民給予學生未來方向的建議,他認為太過熱門的紅海市場,不需要急著投入;反而一定要挑選自己真正感興趣、可以投入且樂此不疲的領域,說不定能獲得另一片藍海市場,就算選擇深耕的議題最後沒有起飛,但起碼仍然能夠獲得經驗「沒有一件事情是你敢百分之百肯定準備好,但你可以說服自己說,你願意為她付出百分之兩百的心力,才能克服困難。」
想進行 AI 研究,孫民分析「邏輯、程式能力與自我表現」是三項關鍵,台灣學生在數學邏輯部分多半經過紮實的訓練,因此相對具有優勢;而程式能力對於跨領域的孫民來說曾經比較吃力,但是透過模仿他找到快速進步的捷徑,「我注意到有個實驗室的學長,他的 code 特別好 maintain,就刻意坐在他旁邊看他寫。」此外,他認為程式能力就是需要做中學,非常建議同學勇於參與開源專案,跟其他人實際合作程式開發,來印證教科書當中提出的概念。
最後則是跨越語言障礙自我表現的機會,「機器學習到現在都是一個很廣很新的領域,很重要的是怎麼跟其他有相關經驗的人討論」孫民指出要透過很多非正式的場合建立人脈,「你要怎麼present?怎麼promote自己?怎麼問到問題的精髓。」訓練口語與心裡素質通是非常重要的,孫民也豁達地表示:「大家都有各自的口音,你也是台灣口音沒什麼好害羞的。」
台灣的AI發展的下一步,該如何佈局,孫民提到台灣人才的培育非常優秀,過去硬體代工的表現也是世界頂尖,在 AI 從學術研發到真正進入產業化大約十年,現在正是許多 AI 商業應用要規模化、提升服務效能的關鍵時刻,「我們只要把人才集中在解決有價值的問題上,我們是可以打贏全世界的。」
「AI 現在需要仰賴大量資料,才有 insight,才有有價值的action。」所以孫民認為台灣在思考 AI 的發展時,必須有國際化的策略思維,一定要有國外投資與市場,否則難以規模化台灣 AI 產業。他期望政府能夠持續做好人才培育,並且拋磚引玉吸引外資,讓台灣 AI 企業能夠把服務提供到國外,甚至吸引優秀的國外人才來到台灣,才能幫助台灣在過去的基礎上,打造下一個有價值的產業鏈。
呼應本次嘉年華的主題《後疫情時代的AI大爆發》,台灣的企業該如何面對因應疫情而加速推動的數位轉型。孫民談到企業的型態可以區分為面向客戶的2C端,和面向企業的2B端,這次受到衝擊最嚴重的是2C 端,傳統接觸客戶的線下管道產生變化,因此急欲轉往數位平台來接觸客戶,「Appier在提供AI 服務給2C端客戶方面具有豐富的經驗,能夠在對的時間、用對方式、傳遞對的訊息給用戶。」從2B端看,當然製造端也會受到影響,需要仰賴AI實現自動化生產,未來也更需要工人與機器人協作,更有效率地交付任務。
以企業體的大小來看,大集團其實有能力自己培養 AI 的團隊,但是當疫情來得又快又急,最快速有效的方式還是尋求外部合作夥伴的協助,能省去從零開始要經歷的試錯過程;而針對缺乏資本的中小企業,因為自己沒有餘力培養數位團隊,因此更要找對有經驗的外部合作夥伴,才能迎頭趕上全球數位轉型的步伐。
(本文為教育部「人工智慧技術及應用人才培育計畫」成果內容)