強化電腦影像辨識

2019 年 07 月 26 日2022 年 01 月 04 日 intern CNN, 卷積神經網路, 智慧農業, 皮膚癌, 精準醫療

分享至

撰文／Apurv Mishra｜譯者／宋宜真
轉載自《科學人》2018年1月第191期

過去30年，電腦視覺科技的發展一直不太順利，即使是準確辨識照片的人臉中這種普通任務都遭遇困難。不過，近來「深度學習」（Deep Learning，人工智慧的新領域）技術有了突破性進展，電腦終於能像人類一樣辨識許多種類的影像，成效甚至更好。相關領域的公司也已經把這項科技應用在販售的產品上，未來有望取代或協助目前以人工進行的許多工作，例如駕駛卡車，或是識別醫療上用來診斷病情的掃描影像。

近來，「卷積神經網絡」（Covolutional Neural Network，CNN）這種深度學習方法的進展，成為新的關鍵。動物影像為例，人類可輕易分辨出貓和狗，而透過CNN，機器能比人類更精準辨識出特定品種。突破關鍵在於，針對影像中細微，顯著的特徵，CNN的學習和推論能力比人類還強。

CNN不需透過編寫程式去辨識影像中的特徵，例如動物耳朵的形狀和大小，而是能自行偵測上述特徵。舉例來說，科學家訓練CNN分辨英格蘭和威爾斯的史賓格犬，會先提供CNN數千張動物影像以及這兩個品種的範例影像。接著， CNN就像大多數深度學習網路一樣，逐層進行辨識。

在較低層次，CNN會從影像中學習到簡單的特徵與形狀。在較高層次，則學習到複雜或抽象的概念，以動物影像為例，就是耳朵、尾巴、舌頭、毛髮結構等外觀細節。CNN一旦經過訓練，就能輕易判斷新的動物影像是否具備某個品種的特徵。

CNN技術有賴圖形處理器（GPU）和平行處理技術這10年的長足進展。同時，CNN廣納接受網路上暴增的數位影像，網路世界也為影像辨識領域帶來深遠的改變。

以深度學習為基礎的電腦視覺系統已應用在各領域。這項科技強化了汽車辨識行人的能力，自動駕駛汽車變得更安全。CNN也讓保全監控系統識別群眾行為，提升公共場所和機場的安全。在農業方面，深度學習能應用在預測作物收成、監控水位並協助偵測作物病蟲害以防止擴散。

電腦視覺的深度學習也大舉進入醫藥領域，以利專家解釋掃描影像和病理切片，並為缺乏影像判讀專業人士的地區提供關鍵資訊，包括篩選、診斷、監控疾病進程或治療成效。

舉例來說， 2017年美國食品及藥物管理局（FDA）通過由新創公司亞特瑞斯（Arterys）所開發針對心臟血流量影像的深度學習方式，目的是協助診斷心臟疾病。同年，史丹佛大學的杜倫（Sebastian Thrun）等人在《自然》期刊發表了一種為皮膚癌分類的系統，辨識能力可媲美真正的皮膚科醫生。研究人員表示，這種程式可以安裝在智慧型手機，讓全世界的病患都能「以低價獲取重要的醫療診斷」。這套深度學習系統也往其他醫療領域發展，例如糖尿病視網膜病變（導致失明）、中風、骨折以及阿茲海默症。

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)

(Visited 129 times, 1 visits today)

分享至

views