從臉部表情「看見」說話的抑揚頓挫

你是否在很吵雜的環境當中與他人對話過?即使說話的聲音聽不清楚,但如果是在看得到對方嘴形的狀態之下,基本上還是可以瞭解對方說話的內容。我們平常的對話之所以得以順利進行,除了「聽」得到的語音本身很重要之外,視覺線索也帶來了很大的幫助。

Read more

李飛飛 Fei-Fei Li(1976-)

為解決電腦視覺專案常遭遇樣本數不足的問題,李飛飛透過亞馬遜的外包平台,招募廣大網友為照片標上正確的註解,集結成名為「ImageNet」的大型圖像資料庫。並將ImageNet開放給各路團隊,以該資料庫訓練或測試模型,相互競爭,一度成為AI界的年度盛事。李飛飛同時也十分關注AI的研究與應用倫理議題,例如:AI軍武化、研究團隊多缺乏女性或少數族群的科學家、假消息的氾濫等。2020年出任Twitter的獨立董事,但因為中國移民的身分而備受質疑。

Read more

楊立昆 Yann LeCun(1960-)

與Hinton最初是在一次會議上相遇,發現彼此有著相同的研究主題,於是離開法國遠赴加拿大成為Hinton的博士後研究生。他開發的手寫數字辨識模型LeNet,不但是電腦視覺常見的卷積神經網路(Convolutional Neural Network,CNN)原型,更是首次將反向傳播演算法付諸實踐(於是證實Hinton的想法是可行的)。目前任教於紐約大學,同時是Facebook的首席AI科學家。在2016年的一場會議中,以一個「蛋糕的比喻」強調無監督式學習的重要性,卻意外在學術圈引起軒然大波。

Read more

在深度學習之前 充滿日本職人精神的電腦視覺AI

深度學習是電腦視覺的唯一途徑嗎?日本東京上野町的一家麵包店有著與眾不同的結帳系統:顧客將半透明的壓克力托盤放在發光的方形平台上。上方的攝影鏡頭和螢幕,除了照出剛剛挑選的可頌和甜甜圈外,還以不同顏色的鋸齒圓圈勾勒出每個麵包的輪廓,並加註日語名稱和價格。轉瞬之間,這個系統已經自動結完了帳,只等顧客掏錢。

Read more

天文學聯手生態學 保育瀕臨絕種動物

從機器人、保安監視到娛樂系統,都看得見電腦視覺 (Computer vision)的影子。最近,生態學家把這項技術結合無人空拍機(drone),用以保育瀕臨絕種的野生動物。除了追蹤牠們的數量與動向,生態學家們還借用了天文學家觀測天體的技術,「揪出」那些盜獵者。

Read more

【探索20-5】電腦視覺:一場做了五十年的暑假作業

■1969年圖靈獎的得主,人工智慧之父Marvin Minsky,在MIT任教期間曾經招募學生進行一場暑期的研究計畫,功課是「將攝影機連上電腦,讓電腦描述所看到的東西」。這個預計在一個暑假、由一群大學生就能完成的暑假作業,如今卻成了數以萬計的科學家耗時五十年都無法企及的目標。這就是電腦視覺給我們的歷史難題:我們從來沒有想過要怎麼教一個嬰兒如何去「看」,他就天生會了,但現在又該如何去教會一台電腦呢?

Read more

AI 眼中的世界

人類對周遭環境的感知能力,是藝術創作不可或缺的要素。神經網路在影像辨識上的成效,代表其對見過的物體具有覺察能力。那麼AI的「感知」也可用於創作嗎?電腦科學藝術家將神經網路模型所見以「畫作」實體呈現,一窺機器眼中的世界。

Read more

不知為不知的智慧

訓練電腦視覺時,由於無法完全複製真實世界,由相片、電腦生成影像、真實或模擬影片彙總而成的訓練資料集,便成為AI唯一的教材。藉由人工繪製框界標記影像中的物體種類,AI得以亦步亦趨地學習辨別眼前的物件。雖可在簡化的虛擬情境中很快取得出色表現,然而隨著環境愈加複雜,這樣的做法不免疲態漸露。舉例來說:真實相片中的人像,經常因為角度問題,無法看到完整的手腳輪廓。此外,人工定義的邊框雖然作為標準答案,卻也往往相當模糊。這些問題看似輕鬆,但背後全都指向一個最基本的問題:人工智能應當如何應對真實世界中不可避免的混亂與不確定性?

Read more