從臉部表情「看見」說話的抑揚頓挫
你是否在很吵雜的環境當中與他人對話過?即使說話的聲音聽不清楚,但如果是在看得到對方嘴形的狀態之下,基本上還是可以瞭解對方說話的內容。我們平常的對話之所以得以順利進行,除了「聽」得到的語音本身很重要之外,視覺線索也帶來了很大的幫助。
Read more你是否在很吵雜的環境當中與他人對話過?即使說話的聲音聽不清楚,但如果是在看得到對方嘴形的狀態之下,基本上還是可以瞭解對方說話的內容。我們平常的對話之所以得以順利進行,除了「聽」得到的語音本身很重要之外,視覺線索也帶來了很大的幫助。
Read more為解決電腦視覺專案常遭遇樣本數不足的問題,李飛飛透過亞馬遜的外包平台,招募廣大網友為照片標上正確的註解,集結成名為「ImageNet」的大型圖像資料庫。並將ImageNet開放給各路團隊,以該資料庫訓練或測試模型,相互競爭,一度成為AI界的年度盛事。李飛飛同時也十分關注AI的研究與應用倫理議題,例如:AI軍武化、研究團隊多缺乏女性或少數族群的科學家、假消息的氾濫等。2020年出任Twitter的獨立董事,但因為中國移民的身分而備受質疑。
Read more與Hinton最初是在一次會議上相遇,發現彼此有著相同的研究主題,於是離開法國遠赴加拿大成為Hinton的博士後研究生。他開發的手寫數字辨識模型LeNet,不但是電腦視覺常見的卷積神經網路(Convolutional Neural Network,CNN)原型,更是首次將反向傳播演算法付諸實踐(於是證實Hinton的想法是可行的)。目前任教於紐約大學,同時是Facebook的首席AI科學家。在2016年的一場會議中,以一個「蛋糕的比喻」強調無監督式學習的重要性,卻意外在學術圈引起軒然大波。
Read more深度學習是電腦視覺的唯一途徑嗎?日本東京上野町的一家麵包店有著與眾不同的結帳系統:顧客將半透明的壓克力托盤放在發光的方形平台上。上方的攝影鏡頭和螢幕,除了照出剛剛挑選的可頌和甜甜圈外,還以不同顏色的鋸齒圓圈勾勒出每個麵包的輪廓,並加註日語名稱和價格。轉瞬之間,這個系統已經自動結完了帳,只等顧客掏錢。
Read more近來DeepFake一詞一躍成為媒體的新寵兒。運用這種技術,可以仿造、合成任何政治人物或偶像藝人的影像,讓他們說出不曾說過的話,以達到特定政治目的。什麼是DeepFake?又能如何識破造假影像?
Read more如何用更少的資料訓練一個成功的AI模型?其實只要改變過去標註資料的方式。
Read more人類駕駛會犯錯,但自動駕駛車輛就能帶給我們一個零車禍的未來嗎?
Read more從機器人、保安監視到娛樂系統,都看得見電腦視覺 (Computer vision)的影子。最近,生態學家把這項技術結合無人空拍機(drone),用以保育瀕臨絕種的野生動物。除了追蹤牠們的數量與動向,生態學家們還借用了天文學家觀測天體的技術,「揪出」那些盜獵者。
Read more除了你我生活中常見的影像識別應用外,天文學家也嘗試借助AI的力量,將所觀察到的星系一一分類。
Read more■1969年圖靈獎的得主,人工智慧之父Marvin Minsky,在MIT任教期間曾經招募學生進行一場暑期的研究計畫,功課是「將攝影機連上電腦,讓電腦描述所看到的東西」。這個預計在一個暑假、由一群大學生就能完成的暑假作業,如今卻成了數以萬計的科學家耗時五十年都無法企及的目標。這就是電腦視覺給我們的歷史難題:我們從來沒有想過要怎麼教一個嬰兒如何去「看」,他就天生會了,但現在又該如何去教會一台電腦呢?
Read more電話響了,我們會去接;看見車子,我們會閃避。這些動作對我們來說很簡單,但是機器人做得到嗎?最新的人工智慧發展,已經能夠讓機器感知世界了。台灣大學資訊工程學系教授莊永裕分享了人工智慧技術在電腦影像及視覺上的應用。
Read more