眼見不為憑：假新聞攻防戰

2018 年 12 月 24 日2022 年 01 月 04 日 intern DeepFake, GAN, Sparse coding, 假新聞, 對抗生成網路, 稀疏編碼

分享至

編譯／葛竑志

深度造假？

「身處在這樣的一個時代，我們的敵人可以讓任何人說出一些他從沒講過的話。」鏡頭前，美國前總統歐巴馬語重心長地說道：「嗯……就像是『川普總統是個不折不扣的笨蛋』。」這段今年（2018）四月被上傳到YouTube上的影片，最終透漏令人訝異的真相：影片中說出這席話的，並非歐巴馬本人，而是AI產生、栩栩如生的假影像。

這種AI模型有個相當直白的名字—深度造假（Deepfake），指的是那些以偽造為目的，利用深度學習完成的影像合成技術。其核心技術採用最近頗為盛行的對抗生成網路（generative adversarial network，GAN）。如同這部影片，喜劇演員Jordan Peele的樣貌和聲音為原型，在送入模型後，以歐巴馬的面貌說出一些引發爭議的話。近年來已有不少名人的臉被用作題材，並散佈於網路上。這些看似無足輕重的八卦素材，卻也是個助長假消息散播的利器。

尋找破綻

「剛開始看覺得沒什麼問題，但仔細看之後會覺得不太對，但也說不出奇怪的地方在哪。」這是一位紐約州立大學奧爾巴尼分校的電腦科學家Siwei Lyu，看過Deepfake影片後的感想。他接著回想起學生時代玩過的瞪眼遊戲，影片裡的人和當時的對手如出一轍：完全不眨眼，一種異常但細微的行為特徵。

仔細回想，訓練這種模型需要相當多的影像資料，但有多少自拍照是在閉眼時拍攝，又恰好捕捉到眨眼的瞬間呢？而這或許就是Deepfake可能的弱點之一：因為其無法模仿那些訓練資料集中從未出現過的表情與動作。Lyu也發現：人所表現的正常生理特徵和情緒，舉凡說話的語氣、呼吸的頻率等，也是神經網路難以駕馭、模擬的。這些看似無關緊要的細微之處，反而成了辨別Deepfake真偽的關鍵破綻。

道高一尺，魔高一丈

但就在Lyu利用這項發現，開發出一套能偵測偽造影片的模型，並將研究結果公布不到一週後，有個匿名信件就向他們分享了一部影片[1]。影片中，AI 產生的人臉竟然能正常地眨眼。Lyu坦承，只要釐清Deepfake的問題點，餘下的其實只是時間的問題。最終可能淪為GAN裡頭的生成器（Generator）與鑑別器（Discriminator）間無止境的軍備競賽。「但只要能提高影片造假的難度與技術門檻，那麼也不失為一種突破。」

見微知著

美國國防高等研究計劃署（Defense Advanced Research Projects Agency，DARPA）為了因應假訊息，於2016年推動了一項「媒體鑑識計畫」（Media Forensics Program，MediFor），希望開發出能辨別影像真偽的AI，供情報人員在第一時間判斷情報是否可信。

第一個切入點，是藉由數位指紋（Digital fingerprint）評估影像是否源自於一台真正的相（攝影）機。正因多數電腦無法完全仿造經過透鏡自然成像的影像，只要善加考究相機模型和影像壓縮方式，都有機會篩選出來。

其次則是觀察畫面中的物體是否具備合理的物理特性，例如：特定光照條件下，金屬和玻璃應有的反光或倒影，以至於物件該有的紋理都在考量範圍之內。

最後，「語義」判定，例如畫面中所呈現的時間、地點、天色、天氣，甚至是人潮、車流等背景資訊，是否符合已知的觀察與紀錄（如天氣觀測紀錄），都有可能成為重要的線索。

稀疏編碼

無獨有偶， Los Alamos國家實驗室也在一年後推動了鑑別假訊息的研究。該機構的網路科學家Juston Moore表示：普通的Deepfake模型需要大量圖形的訓練才能有不錯的表現，這也是為何模仿目標清一色都是公眾人物的原因之一。無論模型再怎麼厲害，還是受限於資料庫的大小與內容。不足之處，往往得仰賴重複的圖形結構來補足。

因此，Moore分別對真假影片做稀疏編碼（Sparse Coding）處理，這種方式能夠將影像以各種基（basis）的組合向量表示，並各自建立起真影片與假影片的「字典」[2]。若要判斷一部影片是真是假，只要將它做同樣的稀疏編碼，再與「字典」做比對，就能提供影片真實性的參考了。

眼見不為憑

可能有人會感到疑惑，為何前身致力於美國核武研究的Los Alamos如此重視假信息？事實上，情報的真偽同樣關乎國家安全。Moore說道：若有一張衛星影像顯示鄰國正在進行核武部署，那麼指揮官在決定是否按下飛彈發射鈕前，更應該確認情資的真偽。DARPA計畫經理Matt Turek也預期，在不久的未來，假消息不再局限於單一的照片或影片，若有心人士欲操作特定話題，只要巧妙地安排一連串的消息和發佈時序，都很容易憑空創造出令群眾信服的假證據，而這已不再是陰謀論者的天馬行空而已。

不久，我們都可能被迫對所有的電子紀錄感到存疑。當然，就群眾心理的角度而言，人們本容易因個人傾向，選擇片面相信自己想相信的事物。但這些研究計畫，還是希望設立某些標準，或以自動化模組替媒體把關。畢竟，當假消息氾濫到足以影響政治或法律決策時，恐怕都為時已晚了。

編譯來源

S. Scoles, “These New Tricks Can Outsmart Deepfake Videos – For Now,” WIRED, 2018.

參考資料

Y. Li, M.C. Chang and S. Lyu. “In Ictu Oculi: Exposing AI Generated Fake Face Videos by Detecting Eye Blinking.” arXiv.org, 2018.
H. Lappalainen, “A computationally efficient algorithm for finding sparse codes.” , Master Thesis, 1996.

(Visited 93 times, 1 visits today)

分享至

views