【探索20-2】機器也有補習班?讓你的機器學得更好

photo:pixabay.com CC0 Creative Commons

講師|臺灣大學資訊工程學系教授 林軒田
彙整撰文|楊于葳

林軒田老師曾在線上平台開授機器學習的相關課程,修習對象主要是大學生及研究生,內容較無複雜的數學問題,使用多個平易近人的生活案例,十分適合一般大眾聆聽。

進入「機器學習」領域的契機

90年代是機器學習的寒冬,機器學習領域尚在發展。在老師大學時,系上除了導師林智仁老師以外,完全沒有任何機器學習的課程,也沒有聽過「機器學習(Machine Learning)」這樣的名詞。2000年5月,大三的林軒田教授因專題製作的契機下,開始與林智仁導師學習支撐向量機(Support Vector Machine)的相關研究,學習如何給機器下不同的參數,了解機器如何做出不同的變化與分類等。林軒田老師認為,作為一個機器的研究者,就是以不同的步驟說明好與不好,了解用什麼樣的步驟去駕馭機器。

老師對機器學習軟體的第一印象是「電腦嘛會撿土豆喔?」,打開林智仁導師的實驗室網頁,可以發現一款「會撿土豆」的機器學習軟體,大家可別因為簡易的外觀而小看它,看似簡單的二維圖,實際上是可以對顏色加以分類的,而這款機器學習軟體在Google Scholar 裡面的引用次數,更是多達37,370次呢!我們透過網頁的實際操作,可以限定的區域內,隨機點出數個不同顏色的圓點,讓機器對數個色點加以分類,而分類的結果五花八門,可能是依據色點散佈的位置,也可能與我們設定的參數有關。總而言之,這個二維圖像軟體會對色點加以分類。

有時機器也會出錯,如同遠古時代的人們雖然已經會使用火源,但控制不當也是會引火燒身。在人類逐漸熟練駕馭火的技能後,我們就可以把火的能量轉化為不同的動能,如汽車引擎內的火、飛機引擎內的火,這當中出錯的機率必定要減到最低,因此要讓機器學會能夠判斷錯誤,不過份地鑽牛角尖,以及放寬一定的彈性還要給予修正,就是駕馭機器學習的重要一環。

●機器學習能夠預測股票?

就好像開一個機器補習班一樣,我們在實驗室裡面努力的提升機器在某一個面上的表現,讓某一個面向成績變好,讓我們教導出來的機器學習軟體,拿出去是可以耀武揚威說我們在哪個地方表現比較好的。而機器學習到底是什麼呢?機器學習可以透過學習後,解決某一個特定的問題。雖然成績在教育上不是評量的唯一標準,但我們可以想像,當學生在學校上數學課或英文課時,授課老師想知道學生到底是否學會這項技能,可以用考試去測試學生是否學會,而機器也是一樣的,我們會著重測試我們希望機器學習的部分,如同上述的「分類」技能,我們也許希望機器能提升它的準確度,或者在資料處理後達成特定效果。舉例來說,我們給機器學習過去20年各種不同股市的資料,希望機器能夠預測股票,假如機器學習後的效果驚人,那麼我們有可能得到好的投資預測;假如機器學習後的效果不佳,那麼很可能讓我們的投資一敗塗地。

●機器學習的四種方法

一、知錯能改法:機器學習並不是只能處理兩個變數而已,而是可以多達一千乃至一萬個。假設銀行要核可一個人是否具備信用卡發卡資格,我們可能會請申請人填寫一些資料,再根據銀行人員判定,將資料輸入機器後,各自對應著不同的座標,有些可能是圈圈,有些可能是叉叉。這時,我們已經得到一個圈叉散佈圖了,接著從散佈圖中畫一條直線,看機器是否能夠從中間找到了一條完美的線,把圈圈叉叉切開,如果劃錯了,我們會讓機器學習順時針轉或逆時針轉,針對一個錯誤去修正,直到轉到正確的位置為止。

二、分而治之法:分而治之法又可以稱作決策樹法。假設今天有一筆混雜著舊金山地區與紐約地區的房子資料,我們可以將海拔位置與房價當作X軸、Y軸,接著再以年份畫一刀、房屋總價畫一刀、單位面積再畫一刀,透過這些資料加以區分判別。

三、眾志成城法:臉部辨識系統就是類似於這樣的方式去判讀辨識。假設有20張照片,10張是蘋果的照片,10不是蘋果的照片,我們要讓機器學習找出屬於蘋果的圖片。首先可以教導機器「蘋果是圓的」,但橘子也是圓的,所以我們又可以教導機器「蘋果是紅的」,這時某些青蘋果可能又沒有被挑選到,而且紅番茄看起來變得非常顯眼,於是我們再教導機器「蘋果是有梗的」,這時機器可能就能透過「圓的、紅的、綠的、有梗的」這些資訊,將正確的10張蘋果圖片挑選出來。

四、層層堆疊法:有些流派模擬一個神經元,有些模仿一堆神經元,在這些分類發展過程中,棋類遊戲就是很好的應用,像是熟為人知的AlphaGo。事實上,很多技術的發展,始於模仿大自然,但是最終很可能衍伸出人類在工程學上自己的想法,如同飛機模仿鳥類外型卻不振翅飛行。

●機器學習未來會怎麼用?

總和上述來看,機器學習難道只能用來分類嗎?並不全然,機器學習還能應用於許多地方,例如從已知的評分資料裡面,去反推每個人的喜好是什麼,然後把這些跟特徵組合起來去預測分析未知喜好的資料,進而推薦出用戶的喜好的商品;又例如自動化手寫辨識系統,也是透過機器學習,大幅降低人工判別的便捷方法。未來機器學習可能會大量應用於商業銀行、電子商務系統、推薦系統等,而這也是我們所期待機器學習能夠前進的方向。

 

--
本文整理自:107/10/06由林軒田老師在臺大思亮館國際會議廳所主講之「開發機器的學習潛能—鑽牛角尖或舉一反三?」演講內容。

 

加入好友

944 人瀏覽過