【探索20-2】機器也有補習班？讓你的機器學得更好

2018 年 12 月 31 日2018 年 12 月 27 日 CASE PRESS 機器學習, 深度學習, 預測

分享至

講師｜臺灣大學資訊工程學系教授林軒田
彙整撰文｜楊于葳

林軒田老師曾在線上平台開授機器學習的相關課程，修習對象主要是大學生及研究生，內容較無複雜的數學問題，使用多個平易近人的生活案例，十分適合一般大眾聆聽。

●進入「機器學習」領域的契機

90年代是機器學習的寒冬，機器學習領域尚在發展。在老師大學時，系上除了導師林智仁老師以外，完全沒有任何機器學習的課程，也沒有聽過「機器學習(Machine Learning)」這樣的名詞。2000年5月，大三的林軒田教授因專題製作的契機下，開始與林智仁導師學習支撐向量機(Support Vector Machine)的相關研究，學習如何給機器下不同的參數，了解機器如何做出不同的變化與分類等。林軒田老師認為，作為一個機器的研究者，就是以不同的步驟說明好與不好，了解用什麼樣的步驟去駕馭機器。

老師對機器學習軟體的第一印象是「電腦嘛會撿土豆喔？」，打開林智仁導師的實驗室網頁，可以發現一款「會撿土豆」的機器學習軟體，大家可別因為簡易的外觀而小看它，看似簡單的二維圖，實際上是可以對顏色加以分類的，而這款機器學習軟體在Google Scholar 裡面的引用次數，更是多達37,370次呢！我們透過網頁的實際操作，可以限定的區域內，隨機點出數個不同顏色的圓點，讓機器對數個色點加以分類，而分類的結果五花八門，可能是依據色點散佈的位置，也可能與我們設定的參數有關。總而言之，這個二維圖像軟體會對色點加以分類。

有時機器也會出錯，如同遠古時代的人們雖然已經會使用火源，但控制不當也是會引火燒身。在人類逐漸熟練駕馭火的技能後，我們就可以把火的能量轉化為不同的動能，如汽車引擎內的火、飛機引擎內的火，這當中出錯的機率必定要減到最低，因此要讓機器學會能夠判斷錯誤，不過份地鑽牛角尖，以及放寬一定的彈性還要給予修正，就是駕馭機器學習的重要一環。

●機器學習能夠預測股票？

就好像開一個機器補習班一樣，我們在實驗室裡面努力的提升機器在某一個面上的表現，讓某一個面向成績變好，讓我們教導出來的機器學習軟體，拿出去是可以耀武揚威說我們在哪個地方表現比較好的。而機器學習到底是什麼呢？機器學習可以透過學習後，解決某一個特定的問題。雖然成績在教育上不是評量的唯一標準，但我們可以想像，當學生在學校上數學課或英文課時，授課老師想知道學生到底是否學會這項技能，可以用考試去測試學生是否學會，而機器也是一樣的，我們會著重測試我們希望機器學習的部分，如同上述的「分類」技能，我們也許希望機器能提升它的準確度，或者在資料處理後達成特定效果。舉例來說，我們給機器學習過去20年各種不同股市的資料，希望機器能夠預測股票，假如機器學習後的效果驚人，那麼我們有可能得到好的投資預測；假如機器學習後的效果不佳，那麼很可能讓我們的投資一敗塗地。

●機器學習的四種方法

一、知錯能改法：機器學習並不是只能處理兩個變數而已，而是可以多達一千乃至一萬個。假設銀行要核可一個人是否具備信用卡發卡資格，我們可能會請申請人填寫一些資料，再根據銀行人員判定，將資料輸入機器後，各自對應著不同的座標，有些可能是圈圈，有些可能是叉叉。這時，我們已經得到一個圈叉散佈圖了，接著從散佈圖中畫一條直線，看機器是否能夠從中間找到了一條完美的線，把圈圈叉叉切開，如果劃錯了，我們會讓機器學習順時針轉或逆時針轉，針對一個錯誤去修正，直到轉到正確的位置為止。

二、分而治之法：分而治之法又可以稱作決策樹法。假設今天有一筆混雜著舊金山地區與紐約地區的房子資料，我們可以將海拔位置與房價當作X軸、Y軸，接著再以年份畫一刀、房屋總價畫一刀、單位面積再畫一刀，透過這些資料加以區分判別。

三、眾志成城法：臉部辨識系統就是類似於這樣的方式去判讀辨識。假設有20張照片，10張是蘋果的照片，10不是蘋果的照片，我們要讓機器學習找出屬於蘋果的圖片。首先可以教導機器「蘋果是圓的」，但橘子也是圓的，所以我們又可以教導機器「蘋果是紅的」，這時某些青蘋果可能又沒有被挑選到，而且紅番茄看起來變得非常顯眼，於是我們再教導機器「蘋果是有梗的」，這時機器可能就能透過「圓的、紅的、綠的、有梗的」這些資訊，將正確的10張蘋果圖片挑選出來。

四、層層堆疊法：有些流派模擬一個神經元，有些模仿一堆神經元，在這些分類發展過程中，棋類遊戲就是很好的應用，像是熟為人知的AlphaGo。事實上，很多技術的發展，始於模仿大自然，但是最終很可能衍伸出人類在工程學上自己的想法，如同飛機模仿鳥類外型卻不振翅飛行。

●機器學習未來會怎麼用？

總和上述來看，機器學習難道只能用來分類嗎？並不全然，機器學習還能應用於許多地方，例如從已知的評分資料裡面，去反推每個人的喜好是什麼，然後把這些跟特徵組合起來去預測分析未知喜好的資料，進而推薦出用戶的喜好的商品；又例如自動化手寫辨識系統，也是透過機器學習，大幅降低人工判別的便捷方法。未來機器學習可能會大量應用於商業銀行、電子商務系統、推薦系統等，而這也是我們所期待機器學習能夠前進的方向。

--
本文整理自：107/10/06由林軒田老師在臺大思亮館國際會議廳所主講之「開發機器的學習潛能—鑽牛角尖或舉一反三？」演講內容。

(Visited 126 times, 1 visits today)

分享至

views