「快樂」與「happy」是同一個意思嗎?從語言文字中理解情緒
情緒是人類在進行語言溝通時,同時也會表達出來的主觀經驗,而情緒除了透過語言文字本身來傳遞之外,也會透過臉部表情、肢體語言等等其他方式傳遞。不過,在現代社會中,大量語言文字的交流占據了我們的日常生活,甚至因為網際網路、社群媒體等的連結,讓世界各地的人們得以互相交流。那麼,能不能透過現代化的自然語言處理技術,跨文化、跨語言的理解人們字裡行間的情緒呢?
撰文|王冠云

心理學的情緒理論
要讓電腦學會分析情緒,得先從心理學方面如何討論情緒開始,Wang等人 (2025) 整理了心理學研究情緒的兩大取向。其中一種是以「維度 (Dimension Model)」來劃分情緒,最早期為Russell提出,以「價性 (valence)」和「喚醒程度 (arousal)」為情緒主要的兩大核心特徵來描述情緒經驗,後續更衍伸出「PAD」模型,透過三維的向度:「愉悅程度 (pleasure)」、「喚醒程度 (arousal)」以及「支配程度 (dominance)」來描述情緒。
另外一種描述情緒的取向則是以「種類 (Categorical Model)」來進行情緒的分類,將人類的情緒狀態用多種情緒的基本種類來進行描述,最廣為人知的是Ekman提出的六大基本情緒,分別為生氣、噁心、恐懼、喜悅、傷心以及驚訝。
然而,上述兩種類型的理論都各自有不同的擁護者以及批判者,批判維度取向的學者認為以二到三種維度並不足以描述情緒的複雜度。另一方面,批判種類取向的學者則認為情緒無法明確地進行劃分,而且難以進行跨文化的比較,因為不同文化用語描述情緒的用語,可能會產生若干不同,並不是所有的情緒語言都是等價的能轉換在各個文化之間。而各種批評其實都反映出了一種現象,即情緒詞之間的語義邊界是很模糊的,它們並非完全獨立,這使得在研究方面,會產生相當大的困難。
將情緒視為一種分布
在Wang等人 (2025) 的研究中,提出了一個「情緒空間 (Emotion Space)」的概念,而且不同於維度取向只抓取維度空間內的單一點,也不同於種類取向將情緒的界線劃分明確。他們將情緒視為在情緒空間中的分布的向量集合,而奠基於過去的研究,仍然使用Ekman所提出的基本情緒種類作為情緒空間內的情緒狀態,但是應不會將情緒置放於任何單一種情緒,而是將情緒視為一種空間內的分布,只是在這個群集 (cluster) 當中,有一個群集的中心,是可以被分類的。
舉例來說,「為Sheva的目標歡欣」以及「從戰勝貧窮中締造和平」這兩句話都是喜悅的話,但是他們所包含的情緒不只是單一種類,前者含有更多「興奮」的成分,後者則是包含著有「希望」的感覺。不過為了進行與其他模型的比較驗證,在研究的驗證方面還是會將其分類到基本情緒中的「喜悅」種類中,只是這種標籤方式稱之為「軟標籤」,也就是說,即便被分類到某個標籤上,仍然含有著前文所描述的「分布」的概念。而Wang等人 (2025) 把它們用來計算每句話的情緒的演算法稱之為「分布式情緒種類表徵 (Distributed Representations of Emotion Categories, DREC)」。而在向量處理方面,又分為直接使用計算出來的軟標籤「DREC-SL」或是加入強制對稱性的「DREC-FS」以更加符合心理學理論,因此在該研究的模型命名上,會經常看到「SL」或「FS」的描述。
與其他演算法或模型的比較
在進行DREC這新演算法的驗證方面,Wang等人 (2025) 使用了GoEmotions資料集,裡面有已經被標註的5萬8千筆國外論壇「Reddit」上面的英文評論,並且用27種情緒詞來進行標籤。
Wang等人 (2025) 將研究內提出的模型與TextCNN、BiLSTM、BERT等模型進行比較,使用了研究者所提供的演算法後,確實能夠更清楚的辨析不同的情緒,且更接近於真人的表現。
此外,為了擴展到跨越語言的應用,Wang等人 (2025) 也將演算法套用到一個含有英文、西班牙文、阿拉伯文的情緒語言的資料集「SemEval 2018 Task1」這個以研究跨語言的情感分析來說最為完整的一個資料集,裡面有這三種語言的11種情緒種類的標籤,來源都是社群媒體 (Twitter)。
而使用Wang等人 (2025) 的演算法進行計算之後,確實發現了在情緒用詞的相似度上,英語和西班牙文的相似度更高,這兩種語言和阿拉伯文的相似度較低,呈現了不同語系和歷史發展的影響。最後,這篇研究也有和目前當代的大語言模型(和GPT-4o、Deepseek、Qwen)進行比較,發現了以研究者所提出的演算法來進行情緒詞的分類,表現並不遜色於大語言模型。也就是說,在自然語言處理情緒分析方面,該研究提出了一個較為輕量,不須使用預訓練模型的方法。同時,在最後進行跨語言測試時,也驗證了語言學演化以及心理學上分類語言和情緒的相關理論。
參考文獻
- Wang and C. Zong, "Learning Emotion Category Representation to Detect Emotion Relations Across Languages," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 47, no. 6, pp. 4752-4767, June 2025, doi: 10.1109/TPAMI.2025.3545447.
- 〈情緒研究與人機互動〉,臺灣社會機器人學學會。