強化學習模型的診斷工具──bsuite

DeepMind近期在Github一口氣開源了三個與強化學習相關的框架,分別是bsuite、OpenSpiel和SpriteWorld,並有意將其中的bsuite推廣為強化學習的標準測試框架。DeepMind收集並提供許多具有代表性的實驗環境,使得bsuite有能力分析演算法的優勢與劣勢,並以雷達圖的方式呈現。

Read more

像人類一樣學習

人類會運用抽象概念,透過想像來達成目標。例如照著IKEA家具的組裝說明書,在腦中構思該如何組裝物件,也透過實際動手,學會了更多新概念。而後這些較高階的新概念又可被進一步延伸,解決其它問題。只是,這一連串看似理所當然的認知過程,卻遠非我們想像中的簡單。

Read more

自駕車緩解塞車窘境

許多幹道每逢尖峰時段便會大塞車,然而除去天候不佳、車禍等不可抗力因素外,造成塞車的原因往往來自人類駕駛本身:只要任一位駕駛突踩剎車,就會導致後方車潮一連串走走停停的現象,讓交通大打結。不過柏克萊大學的研究團隊發現:只要在車潮中混合一定比例的自駕車,就能有效緩解壅塞情形,甚至將整體車速提升至兩倍,解決塞車窘境。

Read more

機械手臂靈巧性再升級

科技發展蓬勃的今日,機械手臂已跨足各個領域,輔助人類提升工作效率。其所追求的最終目標,不外乎是能和人類的雙手一樣敏捷,以執行更精密的任務,惟現有機械手臂的靈巧性仍遠不及人類。因此,OpenAI團隊推出結合AI的全新系統Dactyl,透過強化學習和能高速平行運算的訓練平台Rapid,讓Dactyl在50小時的訓練過程中吸收相當於100年的學習經驗,更自行摸索出人類常用手勢,大幅提升機械手臂的操作靈活度。

Read more

遊戲AI不是只會玩遊戲

在完整資料難以取得,或資料規律性不明顯的情況下,強化學習成為機器學習的另一種途徑。如同小孩一般,AI藉由不斷嘗試,從錯誤中學習並成長,電玩遊戲中的超現實設定則提供了一個絕佳的實驗與訓練環境。除了摸索致勝訣竅外,更需學習如何與團隊合作,增長未來在現實生活中解決問題的能力。

Read more

AI化身電競選手,展現團隊合作默契

今年(2018)八月,繼AlphaGo與世界棋王的精彩對弈後,AI又再次向人類下戰帖。只是,這一次,不再是一對一的對決,而是團隊競賽。由非營利組織OpenAI打造的OpenAI FIVE團隊,迎戰五位頂尖人類電玩高手,在Dota2(一款多人線上策略遊戲)國際邀請賽上展開對決。較量的,不僅是高超的遊戲技巧,更是團隊合作精神。

Read more