與數據拔河：AI的應許和限制

2019 年 02 月 08 日2022 年 01 月 04 日 intern AlexNet, Caffe, DeepQ, ImageNet, 數據導向

分享至

講者／張智威（HTC健康醫療事業部總經理）｜彙整／連品薰
整理自2018.12.16〈CASE探索系列講座第20期．AI能讓我們更幸福嗎？〉

數據導向的盲點

張教授首先以在喜馬拉雅山區拍攝的照片為我們做了示範，如果將尼泊爾路邊乞討的婦人和拉薩街上膜拜的信徒的照片輸入加大柏克萊Caffe的圖片分類器中會得到什麼標籤呢？目前AI的技術雖然還無法標示出抽象的概念如貧窮、苦難，虔誠，但可以期待它能辨識出圖片中的「物」如街道、人等。然而實測的結果卻是將喜馬拉雅山區居民辨識成狗、寵物。這不是因為AI或電腦對人種有歧視，而是因為它無法對於沒有見過的「物」作出正確的判斷。數據導向（data driven）的人工智慧是建立在大量及多元的資料才能成就，目前的ImageNet在數據的量上達到了標準，但可能只有極少數喜馬拉雅山居民的照片，所以AI認不出他們。於是，身為人工智慧產業的實務者我們應該自問：在我們負責的產業我們有足夠而且多元的數據嗎？如果沒有的話，這波AI的文藝復興也許對我們的實務毫無助益？深度學習於1985年被開發，但直到2014年才起飛。張教授2007年起在google進行數據導向大規模機器學習開發時，被當時的同仁合理質疑。因為較複雜的算法譬如SVM或深度學習太過耗時，跟不上搜索引擎和廣告推薦系統的即時需求。在2012年AlexNet利用ImageNet數據取得革命性的圖片辨識的準確率後，學界業界同時驚艷，也才願意投資大規模運算GPU平台，接受了數據導向大規模機器學習的典範。而在2016年AlphaGo又告訴了全世界：如果你的算法能自行生產出無限多且多元的數據，那你便能造就IQ等同於300的機器。但這波的AI革命其實只推進了深度學習，而發展的面向也只限於模擬人腦的知覺（perception）功能。至於如何使用人腦知覺之外的能力，譬如知識，記憶，計畫，邏輯思考，以便從小數據演繹出等同於無限多且多元大數據的能力，還沒有跟上。所以今年四月AI界的巨擘Michael Jordan甚至宣稱：「AI革命尚未到來。」

讓AI處理AI

理解了當前AI的技術發展與限制後，我們應該去思考：如果有大數據能做什麼？沒有大數據又該怎麼辦？史丹佛大學的吳恩達指出：「很多公司還不了解如何使用AI，沒有很多團隊知道該如何執行。」一個AI團隊要能真正運作，至少需要十個算法很強的、十個系統很強的成員。但頂尖的AI人才多數會選擇進IT公司，而其他擁有大量數據如Johnson & Johnson這樣的企業，其實很難能雇用到尖端AI人才，而這也是台灣市場所面臨的問題。張智威認為，AI應用需要的其實是能夠開發新的算法、或把既有算法自動化的人才，其他的技術層面都應該盡量自動化，而不是訓練更多人出來從事低階選擇模式調參數的工作。「讓AI來處理AI」也是張智威推出DeepQ AI Machine背後的宗旨。讓AI自己來替AI選擇模式調參數，安排GPU數量，減低IO，達到最大加速最小模組的優化。

智慧醫療

DeepQ在健康醫療產業的貢獻是讓人們平時就可以做到簡單的身體檢測，它能為使用者做「導診」，並建議他們去特定門診掛號。這背後的理念是想為醫生收集到更完善的身體資訊，達到輔助看診的目的。五年前張智威的團隊參加了Tricorder Xprize比賽，目標就是要製造出可以進行疾病自我檢測的輕便儀器，其內容包含驗血驗尿、光學檢查、呼吸診斷、心率血壓測量和問診等。其中的「問診」功能便是利用增強學習（reinforcement learning）技術，但相較於AlphaGo的棋譜的可能性，症狀與疾病的關係更為複雜，而最關鍵的問題在於symptom checker不能像AlphaGo自己跟自己下棋一樣的生產無限的數據。為了降低問題的複雜性，團隊使用階層性增強學習，也就是將問診分為兩個階層，先是主代理人（醫院院長）做出大致的分類，再讓副代理人（各科主任）就更細層的症狀作出診斷，如此一來把原本35%的準確度一舉提升至80%以上。

另一個難題則出在光學檢測上。以中耳炎為例，標註的圖片資料只有一千多筆，AI的準確度便只有75%，就算加上人工特徵篩選也只能達到80%。這時團隊裡的工程師突發奇想，把網路上雜七雜八的圖片一併丟進去模型裡跑，張智威笑著說：「當時我覺得真應該把這個人fire掉，但沒想到結果出來準確度提升了整整10%。」這背後的原理是，看似毫不相關的圖片和中耳炎共享了某些低階特徵。而中階的特徵可以利用明喻達到類比的效果。例如流膿的中耳炎圖片就跟拿鐵有幾分相似，紅腫的跟紅色絲絹有幾分相似。另一個構想則是讓AI自己製造圖片資料，但若缺乏醫療專業知識的指導，AI可能會製造出太多不符合生理事實的圖片。這個問題就像是，若我們只能提供AI紅色玫瑰的圖片，它要如何才能猜出玫瑰有其他種顏色？這個問題的解決，或許才能稱為真正的AI革命。DeepQ團隊已有初期突破。

最後張智威也提到他對AI前景的期許。他希望AI在將來不只是能夠辨識出喜馬拉雅山上的「孩子」，也不只是給出「快樂」的標籤，甚至要能指認出「天真」。AI可以讓人更幸福嗎？張智威認為健康是幸福的前提，透過發展AI，他希望能為未來的孩子們帶來更好的健康。

(本文為教育部「人工智慧技術及應用人才培育計畫」成果內容)

(Visited 61 times, 1 visits today)

分享至

views