上個世紀的劍橋分析群眾分析的漫長歷史

2021 年 09 月 03 日2021 年 10 月 04 日 CTKao 個資, 劍橋分析, 行為分析, 隱私

分享至

你以為群眾分析是在社群媒體之後才出現的嗎？其實它是上個世紀的產物。

編譯／江彥成、黃思齊

●無所不在的人類行為分析

2016年，「劍橋分析」（Cambridge Analytica）公司在美國總統大選期間，透過Facebook上免費的心理測驗竊取用戶個資，並利用這些資料左右選民的投票傾向。同年英國脫歐公投，支持脫歐的倡議團隊也曾利用類似的個資漏洞，操弄選民的情緒，使得「同意脫歐」的票數以些微之差勝出。

除此之外，若你曾經在美國銀行或陸軍工作，你很有可能聽過Humanyze這間公司。這個由麻省理工Media Lab催生的新創公司，專門提供具有追蹤功能、內嵌RFID（Radio Frequency IDentification，無線射頻辨識技術）的識別證、NFC（Near-Field Communication，近距離無線通訊）感測器、能記錄說話者對話時的語調與音量的內建式麥克風等產品，「以科學分析方法，打造更健康、高效的工作環境。」

若你是在健康照護、零售或金融服務商工作，則很有可能使用過Receptiviti所開發的軟體。透過監控員工的電子郵件和Slack（通訊軟體）訊息中負面用詞的出現頻率，Receptiviti宣稱可以「幫助機器更了解人們」，培養企業內部的「集體正念」（corporate mindfulness）。

提供這類群眾分析（people analytics）服務的服務商，往往對外宣稱以「提升效率」或「改善客戶體驗」為主要目的，卻刻意迴避一些基本問題，例如：誰應該知道你的什麼訊息？他們知道的資訊有多細？是否符合實際情況？他們將這些資訊用在哪裡？以及，最關鍵的，「人類行為」真的可以以一個演算法來概括、預測嗎？

●歷史上的群眾分析

這些問題並不新，歷史上有許多人都試圖回答過。

1959年，一間稱為Simulmatics的公司在紐約市成立，名字是「simulation」（模擬）與「automatic」（自動化）兩字的混成字。創立Simulmatics的人其心各異，有單純希望揭開人類行為秘密的瘋狂社會科學家Ithiel de Sola Pool（他也是最早預見社群網路潛力的學者之一），也不乏看上其中商業利益的廣告人Ed Greenfield。他們擁有同樣的目的：利用稱作People Machine的電腦程式，將群眾分門別類，並模擬各類族群的行為模式，以此來預測或操弄人類行為，或更精確來說，「選民的投票傾向」。

20世紀中期，美國共和黨開始像推銷日常雜貨的方式向選民介紹黨內的政治人物。民主黨不甘示弱，找上了剛成立的Simulmatics，打算來一場（在當時）「跨時代」的廣告行銷。於是Simulmatics的第一個大客戶，正是參加1960年美國總統大選的民主黨候選人，同時也成功成為美國第35屆總統的甘迺迪。Simulmatics的成功，在當時引起了不小騷動，認為這類技術服務會侵蝕民主體制的基石（Facebook則是將近半個世紀後的事了）。

儘管如此，Simulmatics仍然引起了五角大廈的興趣，認為可以用來阻止共產主義的擴張。1966年，Pool與美國國防部合作，在越南西貢（今胡志明市）展開大規模行為科學研究。當時的美國國防部長Robert Barry Goldwater和Pool都天真地以為，能在「心靈和思想」上征服越南人。

除了外戰，Simulmatics也曾被應用於內亂。1965年起，美國境內各處開始出現因為種族衝突而引發的暴動與民亂，終導致「1967年的長夏」（The Long, Hot Summer of 1967）。不堪其擾的美國總統詹森，於是召集了「國家內亂諮議委員會」（National Advisory Commission on Civil Disorders，通常以該委員會主席的姓氏暱稱為「Kerner委員會」）以為因應。Simulmatics則又受Kerner委員會的委託，預測騷亂可能發生的地點與時間，讓當局可以預先準備。

和在越南的任務相同，Simulmatics再一次徹底失敗，不久便宣告破產。

●這個世界太複雜

在此之前，歷史上還有許多類似的群眾分析研究，比如20世紀初的優生學運動（eugenics），都試圖藉著數據的搜集與系統化，在政府單位的配合下，將群眾以種族（race）與族裔（ethnicity）分門別類，並以此預測他們的行爲。Simulmatics或許是其中最不為人知，但卻最接近成功的一次嘗試。

Simulmatics的失敗，不可否認地，部分歸咎於1960年代硬體設備上的不足與限制──數據不足、電腦太慢、設備破爛，導致模型的預測能力不足。然而更重要的一點，以及Simulmatics今日在矽谷的後代都忽略一項事實：美國選民與越南鄉村人口之間的差異、美國國內有色人種與高加索人種間的差異，人類行為以及社會的複雜和多樣性遠超乎科學家的想像！

1966年，在美國國會有關數據隱私的聽證會上，RAND智庫的科學家為議員列出了一系列立法重點：什麼是數據（data）？數據屬於誰？數據的收集者、持有者與分析者各負有哪些責任與義務？數據可以共享或出售嗎？這類大哉問隨著Simulmatics宣告破產而無疾而終，直到現在，群眾分析的技術已經十分成熟了，卻還遲遲等不到答案。

編譯來源

Rosen, C. (2020). The long, complicated history of “people analytics”. MIT Technology Review.

參考資料

Adams, T. (2020). Jill Lepore: 'When did we hand Google, Twitter and Facebook the reins?'. the Guardian.
The Bumbling 1960s Data Scientists Who Anticipated Facebook and Google. Nytimes.com. (2020).
劉致昕（2020）。專訪前「劍橋分析」業務總監：只要臉書的生意繼續，民主就有危機。報導者The Reporter。

(本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯)

(Visited 132 times, 1 visits today)

分享至

views