【AI的多重宇宙】UNIVERSE-05 女科學家的AI跨域之旅:談AI跨界合作、創新與溝通力
有人稱2023年是人工智慧科技的前寒武紀元年,因為該領域的蓬勃發展,如同生命大爆發當時的盛況。正因如此,如何將人工智慧應用到不同領域、和不同領域的科學家合作,變成當今重要的課題。本場講座邀請的兩位女科學家,都在各個AI跨領域研究上持續努力著。將運動科學與人工智慧結合的胡敏君教授,不僅開發出許多輔助運動員訓練的系統,也協助國家隊選手們進行戰術分析。投身於臺灣人工智慧教育推廣的陳宜欣教授則與教育部聯手推動人工智慧教育計畫,期望將人工智慧推廣到各行業,也透過繪製課程地圖,讓學生一步步從認識、理解理論到實際應用。期望透過本場跨域之旅,讓臺灣的AI應用走向更創新、更多元的未來。
講者、審定|清華大學資訊工程學系 陳宜欣 教授 × 清華大學資訊工程學系 胡敏君 教授
彙整、撰稿|周書瑋
2023年被稱為人工智慧的iPhone時代,人工智慧不再只能進行預測和決策,生成式人工智慧還能產出音樂、圖畫和文本,對世界帶來全面性改變,就如數年前iPhone問世時,大家赫然發現,手機不只可以通話,還可以上網甚至照相,更有人稱2023年是前寒武紀元年,因為人工智慧科技的蓬勃發展,如同生物紛紛出現的史前時代。正因如此,如何將人工智慧應用到不同領域、和不同領域的科學家合作,變成當今重要的課題。本次「AI的多重宇宙」系列講座邀請到清華大學資訊工程學系陳宜欣和胡敏君教授,分享她們在不同領域的經歷,如何將自己的興趣和人工智慧結合,與其他領域的專業人士合作,發展跨領域的人工智慧合作計畫,讓人工智慧更全面的滿足人類需求。
人工智慧和籃球之間的橋樑
胡敏君教授從小就很喜歡打籃球,上大學後更是經常參與校際籃球賽,進入研究所後,她開始思考自己的研究領域是否能結合籃球,如此一來,如果研究上遇到瓶頸,才比較有動力走下去。十幾年前的人工智慧當然沒有現在這麼厲害,運動研究學者往往為了偵測畫面中是否有球存在和球的位置而吃足苦頭。近幾年,人工智慧技術愈臻成熟,胡敏君教授發現,AI在動作辨識技術、運動影片製作和分析上都越來越有可行性和發展性,落地應用的機會大大提升,決定投入運動影像分析的世界。2021年東京奧運時,胡敏君教授團隊協助中華隊的桌球隊和拳擊隊進行智慧情蒐,也幫助射箭隊進行VR意象訓練。因為這樣的經歷,她漸漸發現有些分析系統有商業化潛力,甚至可以和籃球聯盟合作,提供多元賽事轉播和加值服務,因此在2023年時成立了新創公司,同時持續擔任中華隊杭州亞運運動科學小組委員,希望協助國訓中心的選手規劃更多資訊系統,統整並提升他們的表現。
要幫助籃球員提升訓練效果和比賽成績,首先要思考籃球生態圈中有哪些角色,需要什麼來加強他們的表現?首先是球員和教練間的溝通,教練希望球員能快速瞭解戰術傳授和動作修正;再來是觀眾和賽事主辦方,觀眾希望主辦方製造不同的加值效果,像是AR特效、廣告,甚至是和觀眾互動等。
胡敏君教授團隊的一系列發明
胡敏君教授的團隊首先研發出「自動計分員」,主要概念近似於在場邊架設攝影機,讓內建在攝影機內的自動計分員分析系統即時判定這一球有沒有投球,有投球的話,是得分還是失誤?得分的話,是透過投籃、灌籃,還是前一球沒進所以第二球補籃進去?更仔細的還可以告知是精準的空心球,還是彈兩下才進去的幸運球。進球分析做得越細緻,對訓練就會更有幫助。
此外,團隊也研發了「全方位計分員」,可以進行熱點分析,也就是記錄投球、進球位置和進球軌跡,將過去由場邊計分員完成的工作由AI輔助完成,且AI可以記錄得更快速更精準。有了軌跡和事件資訊後,系統就可以進一步分析球隊應該使用哪一種戰術,並進行VR戰術訓練。運動員的特殊技能包含數個層次,第一是認知,也就是「知道這件事怎麼做」,像是戰術教學時,運動員要先學會戰術路徑怎麼跑;動作教學時,運動員要知道防守者站位不同時應該做那一套進攻動作。第二是連結,因為運動員「知道要怎麼做」,和「能否真的在場上做出來」,兩者之間可能有巨大鴻溝,因此運動員需要不斷學習連結他的身體和大腦,當未來一上場時,才能快速面對突發狀況做出對應的判斷和動作,最佳化自己的決策和行為。
系統設計流程參考了設計思考。一開始,教授帶著學生瞭解運動員的痛點和需求,針對運動員在學習戰術上遇到的困難提出可能的改善方法,設計出系統雛形後,尋找一些受試者進行驗證,驗證完後若發現系統有缺陷,就需要想辦法改善。例如VR體驗可能會造成受試者暈眩,就要改善體驗的數位內容和虛擬相機移動的模式;如果發現受試者感受不到球,就要改善觸覺回饋機制;如果發現受試者覺得防守者不夠真實,就要改寫生成軌跡或動作的AI模型,甚至必須搭配多重輸入,整合手勢辨識、搖桿控制、語音聲控和眼動操控等多模態互動方式,讓使用者操作系統時更加直覺便利。
臺灣人工智慧教育進程與未來發展
2018年,教育部聯手各大學教授啟動第一期人工智慧教育計畫,希冀將人工智慧應用於醫療業、製造業、半導體業、音樂產業甚至是金融業等,並搭配三類課群規劃一系列的課程,三類課群包括核心的資料探勘、進階的深度學習,以及應用層次的自然語言,著重於自然語言人才的培育。2020年啟動第二期計畫,目標將人工智慧推廣至物聯網、農業、資安產業、智慧醫療產業、智慧零售和市場預測等,課程設計著重在人工智慧的產業運用。2022年則啟動第三期計畫,推動跨領域連結和人工智慧倫理,把過去大家以為集中在電資領域的知識,擴散教學到不同領域中,讓各領域的人才都擁有人工智慧專業,人工智慧倫理則讓學生及早明白過度使用人工智慧可能帶來的後果。
近期快速竄紅的Chat GPT也在校園中掀起風潮,其原理是根據前一文字或句子預測下一個最可能出現的字。舉例來說,「Chat GPT作為一個大型⋯⋯」這句話後接「機器」的機率是0.33,接「語言」的機率是0.45,接「論文」的機率是0.12,那程式終端就會吐出「Chat GPT作為一個大型語言⋯⋯」這句話。Chat GPT的基本訓練方式在文本中挖洞的克漏字測驗,和給上半句預測下半句,概念相當於國中和高中升學測驗中的國文考試。
陳宜欣教授提到,人工智慧浪潮下,通識教育必須培養學生對社會和科技整合性的理解,以古鑑今,不可將學生侷限在一些特定觀點中,當教師和學生之間出現意見分歧,教師應提供學生無限的可能性,讓學生找到自己的無限性和獨特性。
精彩花絮
📖 延伸閱讀:《【人物專訪】探尋的邏輯——專訪陳宜欣教授》、《【人物專訪】選擇教職,是為了能夠做自己想做的事情——專訪胡敏君教授》