會思考的電腦(2/2)

2020 年 11 月 11 日2021 年 12 月 27 日 intern 過適問題

分享至

撰文╱Yaser S. Abu-Mostafa｜譯者╱鍾樹人
轉載自《科學人》2012年11月第129期

完美配適

上述用於電影評等競賽的機器學習系統，稱為「監督式學習」，也可用在醫療診斷之類的工作上。例如，我們可從患者的病史中找出幾千個白血球影像，並輸入電腦，同時告訴電腦哪些影像是癌細胞、哪些不是。根據這些資訊，電腦程式學會利用特定細胞屬性（也許是形狀、大小、顏色等）來判斷惡性細胞。這個過程由研究人員全程「監督」，他們會把每張影像到底有沒有癌症告訴電腦。
監督式學習是最常見的機器學習，卻非唯一一種。例如機器人學家也許不清楚二足機器人怎麼走路最好，但可以設計程式，讓電腦自動以不同的走法進行實驗。假設某種走法讓機器人跌倒，程式就知道未來不要再那樣走了。

這種方法叫做「加強學習」，基本上就是大家熟悉的嘗試錯誤。在典型的情境中，不論是人類或機器，我們會遇到需要採取行動的狀況，這時並非由別人告訴我們怎麼做，而是自行嘗試，再根據結果加強好的行動、避免壞的行動。最後，我們和機器都學會了怎麼因應不同的狀況。

看看網路搜尋引擎。Google創辦人在1997年前後訓練電腦辨識網頁，不是在網路中費力搜索，而是要求程式在爬梳網路後，先產生一個初步的搜尋結果，再根據使用者的點選頻率強化相關與不相關的網頁。當使用者點選搜尋結果中的某個網頁連結時，機器學習程式就知道這個網頁是相關的；如果使用者略過搜尋結果中前方的某條連結，程式則假設那個網頁不相關。把來自百萬名使用者的反應整合起來之後，程式就知道未來怎麼調整對網頁的評估。

過度問題

研究者經常使用加強學習來處理需要連續動作的工作，像是玩遊戲。例如圈叉遊戲：一開始，電腦可能是隨機把X放在某個角落，這個選擇很有利，比把X放在側邊更常獲勝，於是這個做法就會被加強。研究者會延續這個過程，推論出接下來該採取怎樣的行動才正確——對任何遊戲來說都是如此，包括西洋棋、圍棋，也能應用在高階經濟學，例如用來尋找納許均衡。

但有時候，即使是加強學習也不容易執行，因為我們無法從行動中獲得回饋，此時就必須轉而求助「無監督學習」。具備資料，但缺乏該採取何種行動的訊息（不論是明示的，像監督式學習那樣；或是暗示的，就像加強學習），要如何從資料中學習呢？想從中挖掘出意義，首先要根據相似性幫資料分類。這個步驟叫「聚類」，也就是蒐集未標示的資料，從中推論出隱藏架構的線索。透過聚類，我們對資料會有較清楚的了解，之後再考慮該採取什麼行動。有時單靠聚類就夠了，例如整理圖書館，就只需要依照相似性分類書籍；其他時候，可能得進一步應用監督式學習，來處理聚類的資料。

諷刺的是，機器學習的操作者最容易落入的陷阱，竟然是以過強的運算能力處理單一問題。能否體認這個事實並妥善處理問題，正是專業與業餘人士不同之處。

過強的運算能力怎麼會是問題？機器學習程式企圖從資料裡找出模式，如果運算得太積極，例如運用太複雜的模型來處理有限的資料樣本，可能會誤導自己，偵測出偶然存於樣本中的偽模式，而無法反應真實的相關性。有關機器學習的數學理論研究，有很大一部份在處理這種資料「過度配適」的問題。我們想找出符合資料的真實相關性，但又不想做得太過頭，反而得出一個無法信任的模式。

想了解過度配適如何發生，可以想像一下俄羅斯輪盤（為了單純化，假設輪盤只有紅黑兩色）。有位玩家連續觀察了10回合，總是紅黑互輪，他想：「這輪盤一定有偏差，總是紅、黑、紅、黑。」於是他根據有限的資料在心裡建立了一個模型。第11回合，他把100美元下注在紅色，但就在此時，輪盤證明了它的隨機性，連續兩次停在黑色。玩家通盤皆輸。

這位玩家所尋找的模式並不存在。以統計來講，任何輪盤要連續紅黑互輪達10回合，500次裡只可能發生一次。然而，輪盤過去的結果無法影響未來，下一次的轉盤總是有一半的機率落在紅色。在機器學習領域有句老諺語：如果你拷問資料的時間夠久，它總會招的。

為了避免這種結果，我們採用一種叫做「正則化」的技巧，讓模型盡可能保持單純。模型越複雜，越可能發生過度配適，而正則化可持續檢驗複雜度。

研究人員在驗證程式時，一般也會避免使用訓練階段的資料（而非加工過的資料），來確保程式的性能真實無誤。例如，Netflix大獎就不以參賽者下載的原始資料為評判標準，而是以Netflix人員才知道的新資料進行測試。

預測未來

在機器學習領域裡工作，很難感到無聊，你永遠不知道接下來可以應用在哪裡。有了機器學習，縱使在某個領域裡是生手（例如女裝領域），也能單憑資料進行學習並預測，也因此大眾對這個領域的興趣急遽增加。今年在加州理工學院的春季班裡，有15名主修不同科目的學生選修了我的機器學習課程。這是我第一次把上課資料貼上網路並現場轉播，來自世界各地的數千人前來觀看，而且還完成了作業。

但是，只有當問題擁有足夠大量的資料時，機器學習才派得上用場。每當有人把機器學習計畫拿給我看時，我都會先問一個簡單的問題：你有什麼資料？機器學習無法自行產生訊息，如果沒有足夠的訓練資料，或資料內沒有適當的訊息，機器學習就無法發揮作用。

然而，資料正在急遽增加，也讓機器學習的價值持續上升。這點你大可相信我，因為預測正是我的強項。(完)

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)

(Visited 95 times, 1 visits today)

分享至

views