【人物專訪】以AI工具探究法學問題——專訪李韶曼教授
【AI新浪潮:生成式變革】系列講座
科技治理的轉型:人工智慧的機會和挑戰 2024.4/20(六)14:00
訂閱 CASE YouTube 鎖定直播 開啟小鈴鐺
採訪、撰文|謝馥伊
審訂|李韶曼 教授
一路追隨自己的好奇心,國立成功大學敏求智慧運算學院助理教授李韶曼一步一步走向法律與人工智慧的交會點。
法律系畢業那年,李韶曼選擇不踏上律師、司法官之路,默默耕耘臺灣法學界相對較少學者投入的法律語言學、計算法律分析領域。對她來說,回答法學問題固然重要,但透過運算技術更系統性地檢視、分析法律文本,更是她的關切核心。是什麼一路引領李韶曼從學習法律到學習運算技術、更決心進一步開發適合法學研究的AI模型與分析工具?在她眼中,人工智慧技術又會為法學研究帶來什麼樣的機會與挑戰?
從法律系學生到計算語言學工具開發者
原來,就讀臺大法律系學士班期間,李韶曼已經選修不少研究所的專題討論課程。相對於國考相關的科目、大班授課的模式,研究所專題討論課程中更有機會讓學生獨立提出自身觀點、與同儕交流。李韶曼發現自己很喜歡這樣的嘗試與互動,「所以從大學開始,我就一直在探索自己能不能做學術研究。」
大學、研究所時期,她最好奇的主題是法律用語,「我想所有念法律系的同學都會有一個強烈的感受,就是法條、法律文件都不是通俗的表達。可是,為什麼我們的法律需要透過這樣的風格才能夠表達?」
若要回答此類問題,法律系最常見的分析手法是個案分析,由研究者挑選重要或經典的判決,進行類型化分類與分析。然而,人力有限之下,能夠分析、處理的個案相對法院每天生成的判決很少,這讓她時常感到自己缺乏好的工具去「掌握事情的全貌」。她意識到,「如果沒有更多計算工具,依然沒辦法看到(文本風格)發展過程。」正是這一份不滿足與好奇,引領她踏上學習計算語言學的道路。
研究所畢業後,李韶曼先後赴美國耶魯大學、加州柏克萊大學進修、擔任訪問學者,打下統計、程式設計的扎實基礎。然而,她發現,若想引入運算技術分析法律文本、進行法學研究,讓研究方法更經得起檢驗,還得進一步理解技術背後的原理原則,「甚至得自己開發合適的工具,所以我往這個方向(運算領域),慢慢越走越遠。」
引入大型語言模型,讓法學研究更貼近現象的全貌
結合人工智慧技術,以新穎研究方法回答法學問題,究竟和常見研究方法有什麼差別?李韶曼舉例,傳統法學研究當中,若要計算判決書當中引用外國法院判決的數量,「是讓研究者來計算。」研究者手動標註的優點是,帶著法律訓練的觀點去理解、分類案件,為整理提供脈絡,也為計算結果提供正當性。然而,人工閱讀判決書並手動記錄,仍有可能會出錯,「通常會找兩位以上研究者來負責計算,並且另外設計驗證機制。」她認為,以此方法處理少量判決書非常可行,但判決書量太大時,便很難掌握全貌。
渴望看見全貌的她,後來帶領研究團隊開發工具,並應用大型語言模型,自動標記臺灣法院判決書當中引用外國法院判決的數量。團隊驚訝地發現,「當法院的判決越長,研究生們標記的外國判決引用數量,跟我們模型預測的數量落差越大!」人工智慧工具的開發,實則應作為對人類專業的輔助與補充。
能得到亮眼成果,來自團隊在訓練資料標註的細緻度的堅持與努力。「我們還是從源頭做起,先針對我們好奇的主題,建立文本中可能出現的專有名詞清單,還是必須回到研究生的人工標記以建立資料,花了好一番功夫、經過幾個月密切糾錯,才大概上了軌道、開始訓練我們自己的模型。」
李韶曼強調,由受過法律訓練的專業人士標註,才能夠真的把法律知識注入模型,「比如說,有法律訓練的學生會在標記時區分出刑法、刑事訴訟法在法律框架當中的意義,而不是當作類似的概念處理;又比如同樣的罪名的刑事案件,能意識到犯罪工具的不同、犯罪人跟被害人的關係的不同、故意和過失的不同對於判決結果的影響等等,這些都是對於回答研究問題很關鍵的標記。」
對照國際AI法學社群,思考臺灣法學界的努力方向
目前,臺灣學界鮮少投入法學研究工具開發,也間接導致目前少有非商業化的開源工具可供法學研究者使用。可是,如果學界使用商業化工具,則很可能因為無法清楚掌握語言模型開發過程,難以評估研究限制或有限制而不自知。李韶曼舉例,如果工具開發過程中,是以中國簡體中文訓練的基礎模型為基底,再餵入一些臺灣法律資料「嫁接」出模型(轉移學習,transfer learning),長期使用就有風險,「因為臺灣的法律制度、邏輯概念、相關用語都和簡體中文世界有根本性的差異,這是值得我們深思的地方。」
然而,若要建立屬於臺灣法學界的語言模型,第一個挑戰便是擁有足夠多的資料。李韶曼說,國際法學界已經有許多相關的嘗試,「史丹佛大學法學院的一位教授投入非常多心力在這上面,帶著學生一起建立法律資料庫、比較基準 (benchmark) 系統等等,我非常讚嘆。」她指出,臺灣法學界雖然對於工具的價值有共識,但始終尚未有一個平臺或制度,讓更多人願意提供訓練資料,「不是說有很大量的法院公開判決書就可以了,而是要有更全面的、標註過的資料。比如說有沒有可能把法學院的申論題、好的回答和不好的回答這樣的知識都系統性的蒐集起來?」
此外,臺灣目前的學術環境、升等制度之下,「很多時候大家都想問一個好的、理論上足夠深度的法學問題,對於研究方法有時候並不是非常講究,只要社群中有人使用、也說得過去就OK。開發工具,而不是立刻回答一個法學的問題,很難馬上證明給大家看有何用處,所以需要有更多的溝通和說服,讓大家願意把資料分享出來。」
李韶曼期待,有更多法律人願意投入此領域,而自己能更好地扮演嫁接法學和運算的人。
✨同場加映:《【人物專訪】在生物科技與法律之間跳躍——專訪李崇僖教授》