酸民請小心!自動毀謗偵測系統問世

酸民請小心!自動毀謗偵測系統問世

編譯/賴佳昀

社群媒體的霸王條款

由於《憲法第一修正案》明確保證言論自由,毀謗罪在美國較歐洲或其他地區更難成立。1996年,美國國會一改過去的態度,通過《通訊端正法》:媒體若發表或轉述足以損害他人名譽的錯誤訊息,須負起相應的法律責任。一開始,規範對象僅限於報紙或電視等傳統新聞媒體,直到初審法院認為相同的規範也應套用於日益常見的網路媒體:只要該媒體有某種程度的內容審查制度,即使毀謗內容來自於使用者,該平台也須負起連帶責任。

但此舉卻造成了反效果:許多企業為了規避責任,乾脆不進行任何形式的內容審查(造成言論自由的濫用),或過度審查,強制刪除許多其實沒有問題的貼文(侵害言論自由)。考量到網路平台每天湧現的貼文量,是報紙等傳統媒體的兩三個數量級以上,想要以嚴謹的編輯標準來一一審查這些內容是不可行的,美國國會於是修法,加入第230節條款,豁免網路平台的連帶責任。卻也引發了開頭所說的種種社會亂象,甚至危及民主體制的穩定,《通訊端正法》第230節成了眾矢之的。

毀謗言論的「拼寫檢查」

《通訊端正法》第230節的立法初衷,很大一部分考慮到新舊媒體所刊載與經營的內容,在數量上不成比例。此時,如果有一套可以自動偵測誹謗言論(defamation detection)的系統,在新聞或訊息發布之前就先對有風險的內容示警,人類編輯於是可以善用有限的時間與資源,重點審查這些被標記的內容,網路媒體的特殊豁免權似乎就站不住腳了。

愛爾蘭的Conor Brady,過去曾是一名新聞從業人員。他的兒子Neil Brady,也曾是一名記者,並在國際與歐洲事務研究所(Institute of International and European Affairs)擔任數位政策分析員的期間,接觸過神經網路與機器學習。兩人結合過往的專業,以及對AI的知識,展開自動毀謗偵測系統「CaliberAI」的開發過程。

僅僅是標記出帶有歧視、謾罵或人身攻擊的字詞還遠遠不夠,因為「毀謗」有一定的構成要件,例如:必須有特定對象、隱射或明示該人或該團體涉及一些不為社會接受的行為模式或意識形態,像是竊盜、酒醉或是其他不良行為。最重要的是:將所說的內容包裝成一個事實!所以「我覺得王大明是個騙子」可能離毀謗還有一段距離,但「大家都知道王大明是個騙子」就需要請個律師了。

Brady父子遇到的最大困難,是找到一個現成的誹謗語料庫來訓練模型,畢竟大部分媒體與出版商都致力於不讓這些內容面世,以防有人鑽漏洞,所以CaliberAI需要自己從頭做一個。憑藉自身豐富的記者經驗,寫出一長串誹謗性敘述並不困難。而後這份清單交給團隊中的計算語言學家和數據語言學家,為清單中的敘述做註解,生成一個更大的語料庫,才能用於訓練AI模型。

CaliberAI會針對樣本給出一個分數,從0(非誹謗)到100(確定是毀謗)。例如上述「大家都知道王大明是個騙子」的毀謗分數來到80分,因為這句話具備毀謗言論的諸多特徵:

大家都知道…… 王大明 是騙子
(一段有關事實的敘述) (特定對象) (負面敘述)

當然,這不代表只要你說出這句話就會被法院判定毀謗成立,因為訴訟的判決結果取決於你是否可以證明王大明是個騙子。CaliberAI會提供分析的結果給客戶,而客戶需要依照自身過往的經驗來決定是否同意CaliberAI的判斷。這也是CaliberAI的特殊之處:給出建議,而非打造一個全世界通用的判斷機器。

小科技公司或自媒體的必備工具

不過,專業的記者會需要演算法來警告他有可能正在誹謗他人嗎?優秀的編輯、作者或記者應該要能一眼就發現哪些句子可能有問題,但當預算有限或有出版時間壓力時,難免疏漏。新聞中的「頭條新聞」,或插播的「最新消息」,很有可能都沒有經過完整的編輯與審核程序。尤其在大部分員工都是外包的中小型新聞台, CaliberAI更能體現其價值所在。

社群媒體因為《通訊端正法》第230節的保護,不會因為使用者上傳的內容而被起訴,但這個現況相信很快就會發生轉變。歐盟即將執行《數位服務法》(Digital Services Act,DSA)與《數位市場法》(Digital Markets Act,DMA),美國兩大政黨也十分積極推動第230節的廢止或修正案。屆時CaliberAI不僅扮演被動、通報網路媒體下架不當內容的角色,也能主動警告使用者不發表有疑慮的內容。

編譯來源

(本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯)

views