強化電腦影像辨識

分享至

強化電腦影像辨識

撰文/Apurv Mishra|譯者/ 宋宜真
轉載自《科學人》2018年1月第191期

過去30年,電腦視覺科技的發展一直不太順利,即使是準確辨識照片的人臉中這種普通任務都遭遇困難。不過,近來「深度學習」(Deep Learning,人工智慧的新領域)技術有了突破性進展,電腦終於能像人類一樣辨識許多種類的影像,成效甚至更好。相關領域的公司也已經把這項科技應用在販售的產品上,未來有望取代或協助目前以人工進行的許多工作,例如駕駛卡車,或是識別醫療上用來診斷病情的掃描影像。

近來,「卷積神經網絡」(Covolutional Neural Network,CNN)這種深度學習方法的進展,成為新的關鍵。動物影像為例,人類可輕易分辨出貓和狗,而透過CNN,機器能比人類更精準辨識出特定品種。突破關鍵在於,針對影像中細微,顯著的特徵,CNN的學習和推論能力比人類還強。

CNN不需透過編寫程式去辨識影像中的特徵,例如動物耳朵的形狀和大小,而是能自行偵測上述特徵。舉例來說,科學家訓練CNN分辨英格蘭和威爾斯的史賓格犬,會先提供CNN數千張動物影像以及這兩個品種的範例影像。接著, CNN就像大多數深度學習網路一樣,逐層進行辨識。

在較低層次,CNN會從影像中學習到簡單的特徵與形狀。在較高層次,則學習到複雜或抽象的概念,以動物影像為例,就是耳朵、尾巴、舌頭、毛髮結構等外觀細節。CNN一旦經過訓練,就能輕易判斷新的動物影像是否具備某個品種的特徵。

CNN技術有賴圖形處理器(GPU)和平行處理技術這10年的長足進展。同時,CNN廣納接受網路上暴增的數位影像,網路世界也為影像辨識領域帶來深遠的改變。

以深度學習為基礎的電腦視覺系統已應用在各領域。這項科技強化了汽車辨識行人的能力,自動駕駛汽車變得更安全。CNN也讓保全監控系統識別群眾行為,提升公共場所和機場的安全。在農業方面,深度學習能應用在預測作物收成、監控水位並協助偵測作物病蟲害以防止擴散。

電腦視覺的深度學習也大舉進入醫藥領域,以利專家解釋掃描影像和病理切片,並為缺乏影像判讀專業人士的地區提供關鍵資訊,包括篩選、診斷、監控疾病進程或治療成效。

舉例來說, 2017年美國食品及藥物管理局(FDA)通過由新創公司亞特瑞斯(Arterys)所開發針對心臟血流量影像的深度學習方式,目的是協助診斷心臟疾病。同年,史丹佛大學的杜倫(Sebastian Thrun)等人在《自然》期刊發表了一種為皮膚癌分類的系統,辨識能力可媲美真正的皮膚科醫生。研究人員表示,這種程式可以安裝在智慧型手機,讓全世界的病患都能「以低價獲取重要的醫療診斷」 。這套深度學習系統也往其他醫療領域發展,例如糖尿病視網膜病變(導致失明)、中風、骨折以及阿茲海默症。

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)

(Visited 92 times, 1 visits today)

分享至
views