【人物專訪】華語語言辨識第一人——專訪李琳山院士
●3/20 李琳山老師主講:「芝麻開門:語言的聲音開啟人類文明的無限空間」鎖定CASE直播
在個人電腦剛剛問世還未普及的年代,誰有辦法想像用語音來讓機器打出中文字?只有李琳山院士從八零年代便開始致力研究讓機器聽得懂華語。到底是怎麼樣的經歷與思考,讓院士能做一般人根本想不到的事?還能堅持這條研究道路一路至今?
撰文/黃瑜芳
●亮麗學歷背後的努力與恆心
一九七零年代,李琳山院士從台大電機系畢業後,就順利申請到史丹佛的碩士班入學許可。這樣的好消息對當時家境並不是很富裕的他來說,比起開心更多的是擔心,因為亮麗的入學通知單後面緊接著的就是鉅額的學費與生活費。沒想到父親對於申請到國外唸書的兒子是全力的支持,沒有二話地就給了史丹佛大學三個quarter的學費,令李院士十分感動。但是父親贊助了學費後,生活費還是沒有著落,他就這樣獨自一人飛往美國。他暗自在心中打算,一個quarter的學費拿來充當生活費,自己則要在兩個quarter內找到願意提供他獎學金的教授。
當時在美國「半導體」正夯,但由於選擇熱門領域「半導體」的學生人數太多,競爭激烈,他沒有機會爭取到獎學金,因此他放棄半導體領域,最後找到一位做「衛星通訊」的教授願意給他獎學金。為了留在美國,他毫不猶豫地決定轉換跑道改唸「衛星通訊」,以十足的毅力與恆心,自行研讀相關領域的知識,不放過任何一分一秒可以補足知識的機會,就算是放假也窩在圖書館唸書,博士論文主題就是在聖誕節假期中靈光乍現的。在孜孜不倦的苦讀下,院士只花了三年的時間就完成史丹佛大學碩博士的學位。
●返台貢獻己力 深耕語音領域
1979年就在台美斷交之際,老師申請到台大電機系的教職就回台大任教。事後常常有人問他為何要回台灣,老師的回答一律都是很堅定的「回家不需要理由」。抱著一顆想要回饋母校的心,李院士毅然決然的回台大電機系任教,希望能帶來一些不一樣的轉變。就在回台大任教的第二個學期,偶然翻到一本與語音處理相關的書。雖然自己並沒有語音相關背景,但院士認為裡面的數學並不難,就決定開授一門與語音處理相關的課程,靠著美國求學時所養成的學術研究能力與毅力,一邊教一邊自己學習。課程結束之後,院士不僅對這門技術有了相當瞭解,也開啟了他在語音研究上的學術之路。
八零年代,台北街頭上還有很多打字行,裡面有很多打字員用著排滿數千個按鍵的大鍵盤中文打字機幫人製作中文文件,那是一個中文打字還是一個專業的年代,李院士就在思考我們有沒有可能用聲音來輸入中文字呢?因為中文有一個特色是一字一音,似乎有機會唸一個音輸入一個字。但是這個問題太難了,他於是決定先作一個想來應是比較容易的問題:先讓機器“說”出語句來。即使是這個似乎容易不少的問題,也試了幾年始終無法成功,直到1983年遇到一位語言學家後才發現,原來問題出在中文語句中,每一個音會因為前後連接的字不同,語調抑揚頓挫也跟著改變。舉例來說,「你好」的「你」在後面接了三聲的「好」字之後,「你」的音就不再是三聲,轉變為二聲了。這樣的變化,可以透過數據蒐集進而統整出一般性的模型及規則,因此他重新調整研究方向,分析字音在前後字不同時會產生什麼樣的變化,再將這些規則裝進電腦裡面。在1984年,他終於成功的研發出全球首見,輸入注音便可輸出聲音的人工智慧機器。
●人工智慧會統治人類嗎?
有不少人擔心人工智慧未來是否會統治人類。在一場講座中,李院士回應這個問題時說:「人工智慧不會統治人類,那些只是小說家的幻想而已。」引發全場哄堂大笑。院士進一步向大家解釋機器一直以來比人類強的只有兩件事:「死記」與「快速作大量計算」,機器因此可以記憶大量資料並按照人類設定的超級複雜的指令快速執行巨量資料的龐大計算。搭上軟硬體逐漸進步的環境,人工智慧的發展因此一日千里。李院士的語音辨識模型在早期受限於軟硬體環境的不足,機器的正確率總是讓使用者不滿意。後來的跨國大產業如Apple、Google等公司挾其龐大資源研發出Siri 等語音個人助理,其中的華語語音部分的基礎仍然不出當初院士所建立的架構,可見院士當初研究成果如何具有前瞻性。
●「信號與人生」
李院士除了研究,也在臺大電機系持續開授「信號與系統」必修課程,除了傳道授業,也在課堂中分享其一路以來的學思歷程,鼓勵學生們選擇難的方向去砥礪自己,不要輕易選擇簡單的道路,因為那些每個人都能做到。學生們稱這堂課為「信號與人生」因為在課堂上教授會帶出豐富的人生體驗及面對人生的價值觀。從研究到教學,李琳山院士一路走來不只是研究成果豐厚,在教學的路上更帶領學生朝未知領域前進,勇敢並積極的面對人生的挑戰。不管是研究還是教學,院士都傾盡全力,不辭辛勞,一路堅持,從自身做起為後進晚輩樹立良好的典範。