具AI大腦的智慧相機

分享至

具AI大腦的智慧相機

臺灣大學光電工程學研究所 王勻遠

小眼睛,大智慧

Google公司在今年春季展示了一項前所未有的智慧相機,名為「Google Clips」[參2]。一身輕巧,不過百餘公克,可以扣在在家中任何角落,但他深藏不漏,不僅能辨認家人,還能伺機捕捉夫妻、親子間,甜密、有趣的畫面;更厲害的是,一切所需的運算靠它內部Google自行研發的小晶片,直接在終端完成,無須背後雲端伺服器的大量計算撐腰。

設計團隊精簡既有的神經網路模型[參1],瘦身打造出Clips。他們善用公司既有的純熟技術,如「Google相簿」應用程式,該程式的雲端服務可以替使用者拍下的照片,用27000多個的標籤將照片分門別類,舉凡人物、美食、名勝古蹟等,幾乎包羅萬象。然而研發團隊鎖定了Clips某些特定的功能,它大可不必精通十八般武藝,只要會捕捉有趣的畫面即可,於是乎,它僅需上百個標籤,來辨識畫面中的某些特徵,以輔助判斷。

要如何識別物件,有客觀的參考依據可循,比如讓機器辨識畫面中的小孩,只需餵給它大量有關「小孩」的影片作為訓練樣本,機器便能從圖像的明暗、色彩、輪廓等,摸索出「小孩」應有的模樣,但要如何讓機器看出「小孩有趣的動作」,並精準地自動按下快門呢?無疑這是相對主觀的。因此,研發團隊號招了廣大的攝影專家,替訓練用的影片片段評分,來教會機器哪些片段是「有趣的」,哪些又是「無趣的」。機器再利用那上百個重要標籤(這也是攝影專家篩選出來的),也替影片片段評分,並與人類的分數作比較,逐步確認有趣的畫面中最可能包含哪些特徵。簡言之,機器的審美(趣)觀是集結眾人的主觀感受平均後的學習結果。

圖一、Google所發布的Clips產品。(圖片來源:Google官網)

AI相機身兼多職——看家、保全、居家照顧樣樣難不倒

如果覺得Clips頭腦簡單,只能品味「有趣」的話,還有一家新創公司Lighthouse AI推出了功能更強大的類似產品Lighthouse。它能錄下並辨析家裡的場景,理解人物的舉止、動作,並且支援語音操作介面,可以向它問出「某家人」在「何時何處」做了「哪些事」;例如,小孩放學後幾點回到家,亦或家中年長者的行動狀況。如果家中出現了Lighthouse「不認得」的陌生人,還能透過手機向使用者發出警報,它也結合了AI與3D感測技術,在夜間照樣能正常運作。該公司還強調產品的隱私設定,例如主人回到家後,攝錄功能即刻關閉。這些齊全的功能,全仰賴亞馬遜(Amazon)的網路服務作為堅強後勤。只是,這些新科技產品都要價不斐,Clips單顆249美金(約7500台幣),Lighthouse為299美金(約9000台幣),並須按月訂購10美金的服務。

圖二、Lighthouse的語音搜尋功能。例如,向它詢問:「今早小孩們在客廳做了甚麼事」。爾後它便秀出小孩在客廳玩耍的畫面。(圖片來源:Lighthouse AI官網)

潛在的隱私監視

這些居家型的智慧相機,看似功能強大且便利,但所要付出的,是否只有那昂貴的售價呢?有使用者測試,向Lighthouse探詢任何與妻子接觸的陌生人士,它便給出了某晚她與保母——一位Lighthouse從未見過的面孔,偕同出現的畫面。

也許,真正的代價要等這些產品普及、擴散出家園之後,才會重重地敲響人們內心的警鐘。在中國大陸,有50多個城市的監視系統,部分連結了AI軟體,鎖定所有視野範圍內人們的行蹤,甚至人們所買的東西,以便預測犯罪,在第一時間通報警政系統[參2]。並且中國當局亦在人口約3500萬人的貴州,佈下了「天網(Skynet)」,導入2萬支具備人工智慧人臉辨識功能的攝影機;這些視察的眼睛連接著全國資料庫,一旦認出了某人,便可以馬上掌握他的全部資訊:年齡、種族、家族成員、乃至過去的行蹤[參3]。

國家與人民的整體安全,緊繫著每一個體的隱私。但是否所有人都真的樂意交付自己的隱私給新興科技,來換取提倡者口中的社會福利?當今科技益發蓬勃,「科技與人性」、「自由與隱私」不斷在天秤的兩端爭取平衡,然而,天秤只有這兩端需要權衡嗎?除了隱私,資訊安全也將是個重大議題。愈來愈多的個人資訊以許多管道(如監視器、社群軟體)存入政府單位與企業,這些資訊是否被妥善管理或保護?如果被不肖人士竊取及操縱,那影響整體社會的規模也更加難以收拾,如2016年涉嫌干擾美國總統大選民意的「Facebook劍橋分析」案件[參6],即是一深刻的反思。

編譯來源:https://www.nytimes.com/2018/02/27/technology/future-cameras-ai-brains.html Farhad Manjoo , The New York Times (2018)


參考文獻:

(Visited 49 times, 1 visits today)

分享至
views