會思考的電腦(2/2)

分享至

會思考的電腦(2/2)

撰文╱Yaser S. Abu-Mostafa|譯者╱鍾樹人
轉載自《科學人》2012年11月第129期

完美配適

上述用於電影評等競賽的機器學習系統,稱為「監督式學習」,也可用在醫療診斷之類的工作上。例如,我們可從患者的病史中找出幾千個白血球影像,並輸入電腦,同時告訴電腦哪些影像是癌細胞、哪些不是。根據這些資訊,電腦程式學會利用特定細胞屬性(也許是形狀、大小、顏色等)來判斷惡性細胞。這個過程由研究人員全程「監督」,他們會把每張影像到底有沒有癌症告訴電腦。
監督式學習是最常見的機器學習,卻非唯一一種。例如機器人學家也許不清楚二足機器人怎麼走路最好,但可以設計程式,讓電腦自動以不同的走法進行實驗。假設某種走法讓機器人跌倒,程式就知道未來不要再那樣走了。

這種方法叫做「加強學習」,基本上就是大家熟悉的嘗試錯誤。在典型的情境中,不論是人類或機器,我們會遇到需要採取行動的狀況,這時並非由別人告訴我們怎麼做,而是自行嘗試,再根據結果加強好的行動、避免壞的行動。最後,我們和機器都學會了怎麼因應不同的狀況。

看看網路搜尋引擎。Google創辦人在1997年前後訓練電腦辨識網頁,不是在網路中費力搜索,而是要求程式在爬梳網路後,先產生一個初步的搜尋結果,再根據使用者的點選頻率強化相關與不相關的網頁。當使用者點選搜尋結果中的某個網頁連結時,機器學習程式就知道這個網頁是相關的;如果使用者略過搜尋結果中前方的某條連結,程式則假設那個網頁不相關。把來自百萬名使用者的反應整合起來之後,程式就知道未來怎麼調整對網頁的評估。

過度問題

研究者經常使用加強學習來處理需要連續動作的工作,像是玩遊戲。例如圈叉遊戲:一開始,電腦可能是隨機把X放在某個角落,這個選擇很有利,比把X放在側邊更常獲勝,於是這個做法就會被加強。研究者會延續這個過程,推論出接下來該採取怎樣的行動才正確——對任何遊戲來說都是如此,包括西洋棋、圍棋,也能應用在高階經濟學,例如用來尋找納許均衡。

但有時候,即使是加強學習也不容易執行,因為我們無法從行動中獲得回饋,此時就必須轉而求助「無監督學習」。具備資料,但缺乏該採取何種行動的訊息(不論是明示的,像監督式學習那樣;或是暗示的,就像加強學習),要如何從資料中學習呢?想從中挖掘出意義,首先要根據相似性幫資料分類。這個步驟叫「聚類」,也就是蒐集未標示的資料,從中推論出隱藏架構的線索。透過聚類,我們對資料會有較清楚的了解,之後再考慮該採取什麼行動。有時單靠聚類就夠了,例如整理圖書館,就只需要依照相似性分類書籍;其他時候,可能得進一步應用監督式學習,來處理聚類的資料。

諷刺的是,機器學習的操作者最容易落入的陷阱,竟然是以過強的運算能力處理單一問題。能否體認這個事實並妥善處理問題,正是專業與業餘人士不同之處。

過強的運算能力怎麼會是問題?機器學習程式企圖從資料裡找出模式,如果運算得太積極,例如運用太複雜的模型來處理有限的資料樣本,可能會誤導自己,偵測出偶然存於樣本中的偽模式,而無法反應真實的相關性。有關機器學習的數學理論研究,有很大一部份在處理這種資料「過度配適」的問題。我們想找出符合資料的真實相關性,但又不想做得太過頭,反而得出一個無法信任的模式。

想了解過度配適如何發生,可以想像一下俄羅斯輪盤(為了單純化,假設輪盤只有紅黑兩色)。有位玩家連續觀察了10回合,總是紅黑互輪,他想:「這輪盤一定有偏差,總是紅、黑、紅、黑。」於是他根據有限的資料在心裡建立了一個模型。第11回合,他把100美元下注在紅色,但就在此時,輪盤證明了它的隨機性,連續兩次停在黑色。玩家通盤皆輸。

這位玩家所尋找的模式並不存在。以統計來講,任何輪盤要連續紅黑互輪達10回合,500次裡只可能發生一次。然而,輪盤過去的結果無法影響未來,下一次的轉盤總是有一半的機率落在紅色。在機器學習領域有句老諺語:如果你拷問資料的時間夠久,它總會招的。

為了避免這種結果,我們採用一種叫做「正則化」的技巧,讓模型盡可能保持單純。模型越複雜,越可能發生過度配適,而正則化可持續檢驗複雜度。

研究人員在驗證程式時,一般也會避免使用訓練階段的資料(而非加工過的資料),來確保程式的性能真實無誤。例如,Netflix大獎就不以參賽者下載的原始資料為評判標準,而是以Netflix人員才知道的新資料進行測試。

預測未來

在機器學習領域裡工作,很難感到無聊,你永遠不知道接下來可以應用在哪裡。有了機器學習,縱使在某個領域裡是生手(例如女裝領域),也能單憑資料進行學習並預測,也因此大眾對這個領域的興趣急遽增加。今年在加州理工學院的春季班裡,有15名主修不同科目的學生選修了我的機器學習課程。這是我第一次把上課資料貼上網路並現場轉播,來自世界各地的數千人前來觀看,而且還完成了作業。

但是,只有當問題擁有足夠大量的資料時,機器學習才派得上用場。每當有人把機器學習計畫拿給我看時,我都會先問一個簡單的問題:你有什麼資料?機器學習無法自行產生訊息,如果沒有足夠的訓練資料,或資料內沒有適當的訊息,機器學習就無法發揮作用。

然而,資料正在急遽增加,也讓機器學習的價值持續上升。這點你大可相信我,因為預測正是我的強項。(完)

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)

(Visited 18 times, 1 visits today)

分享至
views