以機器學習和深度學習偵測網路霸凌

分享至

網路和社群媒體的出現,開啟了人類一個新的連結方式和溝通管道,但是隨著社群媒體使用的增加,網路霸凌事件的成長也獲得了很大的關注,尤其是現今社會中也有數起因為網路霸凌而引發的自縊事件,更使得網路霸凌的議題變得更加具有迫切性。

撰文|王冠云

來源:MotionElements

 

網路霸凌的定義及多面向

Ejaz等人 (2024) 在《Computers in Human Behavior》發表的論文中,以偵測網路霸凌為主題,對於各個社群媒體進行了研究,並且也爬梳了與網路霸凌有關的文獻論述。

目前,大多數分析社群媒體網路霸凌有關的研究,大多聚焦在文本分析,且只關注文本中是否含有具攻擊性的語言。但是,網路霸凌不只是文本用詞的問題,舉例而言,「你要哭嗎?就哭啊,看你明天會怎樣!(You gonna weep? Go ahead, watch what unfolds tomorrow.)」在這句話中,可能沒有任何會冒犯他人的詞語,但是卻可以因為情境讓這句話變得具有攻擊性。

因此,為了顧及網路霸凌的多變性及多個面向,Ejaz等人 (2024) 歸納出網路霸凌的四個要件:一、攻擊性的溝通;二、重複持續的行為;三、製造傷害的意圖;四、同儕的參與。以製作一個能自動偵測網路霸凌的系統的角度而言,只考慮文本會讓系統失準。所以,為了訂定更好的標準與定義給霸凌偵測系統,如果能不只是從文本本身來偵測霸凌,將能幫助建立更安全的數位環境。而這些面向都是構成網路霸凌的要件,如果都成立了,那麼就必須得拉起網路霸凌的警報。

 

資料庫盤點與網路霸凌分類架構

Ejaz等人 (2024) 盤點了目前進行社群媒體分析的資料庫,包含Twitter、FormSpring、Instagram、Youtube以及其他在國外比較小眾但也很流行的社群媒體。在臺灣可能比較不熟悉「FormSpring」,這是一個可以讓使用者問他人問題,並以此來開啟對話的社群媒體,但這個網站因為網路霸凌事件而關站了。

不過,以目前的網路霸凌分析而言,研究者指出了幾個過去研究的限制。首先,大部分的研究並沒有觀察互動的使用者們之間的關係,但是網路霸凌常常發生在同儕之間,所以會失去準確度。再者,網路霸凌常常是持續且重複的行為,但是過去的分析只有分析單一次的攻擊語言。另外,過去研究雖然分類了攻擊性語言和非攻擊性語言,但是沒有強調同儕的概念及語言背後的傷害意圖,因此,仍然在分析上顯得不夠全面。

資料庫盤點與網路霸凌分類架構圖|來源:Ejaz et al. (2024),作者翻譯

因此,Ejaz等人 (2024) 提出了如圖的架構,在生成使用者的資料時,同時也會收集使用者的資料,並且將訊息的接受者和發送者進行配對。例如,在同儕關係方面,就會參考使用者的資料來判定關係,舉凡是否同校、是否同年齡等等,可以依照使用者資料來分出配對使用者的關係遠近。而使用者之間的溝通訊息,則是會分析文本的「攻擊值」以及「重複值」,也就是必須要重複持續的攻擊性語言,才算是構成霸凌。而傷害意圖的推算部分,研究者也發想了一套公式,將攻擊性、重複性及同儕關係納入考量,來進行傷害意圖的運算。

 

將訊息轉化為數值,並且進行AI分析

透過上述的架構,文字訊息和使用者資料都會透過研究者所設定的公式,被轉換成一組數值。在Ejaz (2024) 等人的研究中,使用了數個機器學習以及數個深度學習模型來進行網路霸凌的偵測。機器學習部分嘗試使用了多項式單純貝式分類器 (Multinomial-NB)、隨機梯度下降 (Stochastic GD)、羅吉斯回歸 (Logistic regression)、支持向量機 (SVM) 以及淺層神經網路 (Shallow NN)。結果顯示,隨機梯度下降的精確度表現較好。

另外,深度學習方面利用了Google AI團隊開發的BERT神經網路,以及另外兩個團隊所改良開發的「Distilled BERT」以及「RoBERT」。結果發現,使用「RoBERT」並且將研究者的資料進行訓練而得的模型,其精確度的表現最好。

除此之外,由於網路霸凌的各個面向在Ejaz (2024) 等人的研究中透過量化的形式展現出來,在論文中,研究者們也提出了「閾值設定」的概念,例如「同儕閾值」以研究者所提出的公式而言,可以設定0.4,以上表示同儕關係近,以下表示使用者的關係較遠等等。而「訊息重複」的閾值,則落在5。超過五次以上的重複行為,就有可能構成持續性的霸凌。

總結來說,研究者們在這篇論文當中提供了一個新的架構來讓學者們可以用更全面的角度來分析並偵測網路霸凌行為。不過,研究者也提醒,在論文中,使用者只進行了兩兩配對,但霸凌可能是來自於多對一的訊息,在這個架構中可能沒有辦法被處理。另外,雖然研究者也試圖提出可能構成霸凌的閾值,但其實算不算構成霸凌,仍然取決於當事人的主觀感受。此外,網路霸凌本身可能也涉及不同類型的霸凌,若能進一步區分網路霸凌的種類,能把偵測系統變得再更加全面性。雖然還有許多有待商榷的地方,由於過去研究較少統整網路霸凌的定義及各個面向,這篇論文所提供的分析架構,對於建立一個偵測霸凌的系統而言,仍具有一定的參考價值。

 


參考文獻

  1. Ejaz, N., Razi, F., & Choudhury, S., 2024, Towards comprehensive cyberbullying detection: A dataset incorporating aggressive texts, repetition, peerness, and intent to harm. Computers in Human Behavior, 153, 108123.
(Visited 150 times, 1 visits today)

分享至
views