巨量資料下誰有隱私?(2/3)

分享至

巨量資料下誰有隱私?(2/3)

撰文/Jaron Lanier|譯者/王怡文
轉載自《科學人》2014年1月第143期

未來的讀心術

我們被異常好心的技術菁英綁住了。提供社交網絡或網路搜尋等現代服務的大型雲端運算公司,以及他們在資訊情報界裡的對手,大多是出於好意的年輕人。要想像事情會惡化到什麼程度,就得想像這些魅力十足的科技新貴將來會變成憤世嫉俗的老人,或者把他們的王國交給將來那些有權力卻沒頭緒的繼承人。這應該不難想像,因為這類情節已經常見於人類歷史中。如果你認識一些在我們這個以運算為中心的時代中成功的好心科技人,會覺得這種想法很無情,但要對科技有任何先見之明,就必須盡己所能設想那黑暗的一面。

如果一名觀察者擁有功能強大的電腦,能取得夠多關於某人的資料,理論上就能預測並操控那個人的想法與行為。就算今日的網路連線裝置還做不到,未來終將達成。新世代的超便利消費型電子產品可能是一張貼片,只要黏在後頸就能直接讀取大腦,在使用者察覺之前就知道他想去附近哪家咖啡店(如何防範這種產品上市後伴隨而來的黑暗思想,已經變成當代消費性科技的基本挑戰)。

創造那種產品的要素均已備足。已經有實驗室只需透過巨量資料統計分析,比對功能性磁共振造影(fMRI)在不同狀況下的腦部訊號,便可推測出某人正在看什麼、想什麼或甚至將要說什麼。美國加州大學柏克萊分校神經科學家葛朗特(Jack Gallant)的實驗室就是其中一例。因此就某種程度而言,光靠統計分析就能做到讀取心智了。

假設你戴著這種超便利裝置,正打算去一家咖啡店,但還沒決定去哪家,某些組織(未來的臉書或NSA)就能讀取這個裝置,而且驅使你遠離A店而去B店。正當你有意去A店時,你的抬頭顯示器便蹦出一則老闆送來的煩人訊息,讓你轉移注意而感到沮喪,去A店的想法便沒機會進到你心裡;另一方面,去B店的想法帶來的是交友網站上心儀對象的推特訊息,讓你心情大好,頓時覺得去B店真是個好主意。此時你已經陷入新古典制約的操弄,這一切完全發生在你意識到之前。

這個在科幻小說中歷史悠久的想像實驗,說明了運算與統計能有效模擬心智控制。可能再過幾年,越來越貼身的可攜式裝置,裡面的雲端驅動推薦引擎就能實現部份的心智控制情節。

無能之災

警世科幻小說的經典劇情,是安排一個全能的邪惡反派角色。但我關注的黑暗未來不是那樣,而是更可能發生的情節,而且現今已經表現出初期樣貌。它比較不像一個超強反派精心安排的邪惡計畫,而較像是因為無能而導致的不明災害。

在那個故事裡,某個組織或產業為了追求利潤,投入大量資源研發操控大眾的演算法,這種做法一開始確實有利可圖,只是最後會變得很荒謬。這已經發生了!看看美國健保業者運用大量統計運算排除高風險的顧客,短期內是一種有利可圖的策略──直到無保險的人數達到無法承受的量。社會負擔不了這種「成功」的策略。用演算法侵犯隱私為手段來追求財富與權力,最後似乎總是搞得一團糟。

想想現代金融的狀況。依賴大量統計運算的金融體系常常一開始是成功的,有足夠多的資料和運算就有可能推估出證券市場的未來走勢、個人的行為或世上任何平穩變化的現象。但這只是一時的。巨量資料系統終將失敗,理由很簡單,不夠詳盡的統計只能不斷呈現現實的片段倒影。

巨量資料金融系統直到21世紀初才開始侵犯個人隱私(例如建立個人模型並向他們推銷愚蠢的抵押貸款或信用額度)。在此之前,它比較單純:建立證券模型、自動下單投資,完全不去了解這在真實世界產生什麼結果。總部設於美國康乃狄格州格林威治的長期資本管理公司,其避險基金就是一個早期例子。這家紅極一時的公司後來在1998年破產,花了納稅人大把鈔票紓困(高頻交易系統現在以更大量的資料及更快的運算重新啟動了這個模式)。然而,現在高度自動化的金融世界泰半仰賴大規模的個人隱私侵犯──那原本是間諜工具或消費性網際網路的特色。導致美國經濟大衰退的不動產抵押貸款證券,最後結合了個人隱私侵犯和自動交易機制,引發另一波犧牲大眾權益的宇宙級紓困,未來必定也會有類似的紓困。

這不是超強菁英征服世界的故事,而是每個人(包括最成功的巨大雲端服務經營者)都沒能搞懂正在發生什麼事的故事。一開始,侵犯每個人的隱私是行得通的,運算創造了財富,然後就失敗了。這個模式已經造成了金融危機,在未來,不管是誰來執行有最多個人資料且最佳效能的電腦,或許會取得比社會上任何人都更精準的預測及操控全人類的能力,而後果也會更加黑暗。

巨量資料的真實價值

人們在推銷這種蒐集、分析大量個人資料的服務功能時,往往自吹自擂、胡扯一通。容我重述聽過無數次的話術:「就算不是現在,但很快地,超強的電腦就能精準預測並鎖定消費者,足以讓做生意就像按下開關那樣容易。大型電腦的吸金能力就像磁鐵吸鐵屑一樣。」

比方說,我看過一場簡報:希望被大公司收購的某家矽谷新創公司宣稱,他們能藉由分析女性點擊了哪些連結,追蹤她的生理期,然後利用此資訊,在她比較容易聽信廣告詞的期間,向她推銷時尚產品與化妝品。這個策略或許有某種效果,但由於它純粹仰賴統計分析而且缺乏科學理論支持,我們無從得知效果如何。

類似狀況還有政府機關或服務某機關的私人承包商,在推銷一套能蒐集民眾資料的系統時,可能會天花亂墜宣稱這套系統能藉由觀察並分析全世界,在犯人或恐怖份子行動前逮捕他們。這類計畫的術語(例如「全面資訊警覺系統」)顯露出他們渴望像上帝般無所不知。

科幻小說設想這類事情已經幾十年了。例如,多年前我曾協助電影「關鍵報告」做創意發想,該片改編自1956年狄克(Philip K. Dick)的短篇小說,裡面的「預知犯罪」單位負責在罪犯伺機而動前抓住他們。但是我們要搞清楚:這並不是蒐集、分析資料的巨型系統實際在做的事。

創造這類系統的人希望有一天後設資料能支援「自動完成」演算法(猜測我們打算在智慧型手機內輸入什麼的那種)的超級版。統計演算法會填補資料的空缺,藉由這種演算法的幫助,研究犯罪組織的後設資料應該是能帶領我們發現新的、前所未知的關鍵資料。

但至少到目前為止,似乎沒有證據顯示後設資料探勘曾成功防止恐怖行動。我們知道的所有案例,都是專人運用智慧直接找出嫌犯這類的犯罪調查。事實上,無論是政府或私人的各式巨大雲端電腦計畫負責人,描述他們的工作內容時,這些宣稱很快就露出破綻,尤其在仔細解讀之後。是的,一旦出現可能為恐怖攻擊的陰謀預兆,手邊有超大資料庫時,要連結線索是比較快,但是,這些資料庫並沒有在第一時間發現預兆。

最近有個常見的小把戲:對歷史事件做事後分析,企圖證明巨量資料能在秘密計畫發生前就找出關鍵人物。例如用演算法分析與美國民族英雄列維爾(Paul Revere)同時代的人,可發現列維爾是社群網絡裡的核心連結人物。這個例子用的資料是在美國革命戰爭前,他在各組織裡的會員身分,南韓首爾國立大學社會學家韓信甲示範分析一個相當小型、包含各種革命前組織的會員資料庫,可篩選出列維爾這個獨特的連結人物。最近,美國杜克大學社會學家希利(Kieran Healy)也用相同事件但更加多元化的資料庫,獨立推導出類似結果。

當然,列維爾就在那裡,在連結其他人的各群體核心,上述的分析結果對後設資料在安全領域的應用是個好宣傳。不過,要相信這種研究能在事件發生之前做出預測,還有許多因素要考慮。

列維爾顯然地位特殊、是某事的樞紐,然而,由於缺乏歷史背景,我們便無從知道那是什麼事。例如,就連某個能取得最棒啤酒的人,位居群體核心的指標可能也會指向他。後設資料只有在資料來源提供背景資訊時才有意義,統計及圖形分析無法取代事情的來龍去脈,雖然它們總是看似能暫時性的取代。

危險的是,巨量資料統計會創造一種「自動安全感產生機」的假象,就像華爾街一直在追求的「保證賺錢機」一樣。我們個人生活的隱私資訊,正以驚人的量被儲存、分析及運用,卻尚未有合理使用的範例。(待續)

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)

(Visited 35 times, 1 visits today)

分享至
views