開心或生氣?將情緒辨識技術導入適合高齡者使用的聊天機器人

分享至

當今世界已開發國家的人口結構皆趨向高齡化,少子化的問題再加上人口老化,使得每個人的撫養重擔越發沉重,社會上長照的服務資源供不應求,越來越多高齡者無法獲得良好的照護與陪伴,是否有什麼辦法能夠協助紓緩這樣的困境呢?在情緒辨識技術與聊天機器人技術較為成熟的現在,或許我們能夠將導入情緒辨識系統的聊天機器人投入在高齡照護的現場,但也必須注意的是,人類的情緒模式複雜而多變,情緒辨識系統依舊無法完全取代真人的陪伴,多多關心身邊的高齡者仍是我們必須與應該做的事情。

撰文|王冠云

情緒辨識技術和聊天機器人如今各自已經發展到一定的程度。另一方面,面對高齡化社會的到來,高齡者們的心理及生理照護需求也不斷地升高,因此研究者們便開始思考,該如何應用科技補足這塊勞務需求及供給的缺口。將具有情緒辨識技術的聊天機器人導入高齡照護現場,可能就是解決方案之一。

來源:MotionElements

 

情緒是什麼?如何教機器辨別?

在心理學上,情緒 (emotion) 的定義有很多種,最常使用的定義是「一種複雜的反應模式,包含實驗性的、行為的、生理的成分」,常常混淆的詞彙如感覺 (feelings) 和心情 (moods),情緒 (emotion) 這個詞在學術上含有更多「反應」的意思,意指著個體在面對事情或狀況時產生的心理反應。1970年代,知名心理學家Paul Eckman定義了人類的六種基本情緒:快樂 (happiness)、悲傷 (sadness)、厭惡 (disgust)、恐懼 (fear)、驚喜 (surprise)、憤怒 (anger)。至今仍有很多研究沿用這個定義,或是以這六種基本情緒為基礎進行相關的理論延伸。

在情緒識別 (emotion recognition) 方面,目前主要有四種方法:腦波訊號處理、聲音/語音處理、臉部動作處理、文本處理。腦波訊號方面,最常使用的就是EEG的資料,利用EEG腦電波,將訊號送入機器學習模型,再進行情緒分類;聲音/語音處理的部分,則是利用語音訊號來進行分類;臉部動作的部分不只是臉部表情,也可能利用眼動追蹤來進行情緒的識別;而文本分析則往往是利用社群媒體上豐富的貼文及文本材料,進行相關的分類。

 

將情緒辨識模型導入網頁應用程式

Machová (2023) 等人的研究嘗試結合了情緒辨識模型以及聊天機器人模型,讓聊天機器人可以具備識別聊天對象情緒的能力。研究者們的出發點是為了因應現在高齡化社會照護陪伴的需求,尤其是現在有許多生理上的科技輔具,如電動輪椅、機械手臂等等,但卻少有具備社交性或與心理層面相關的自動化工具,因此Machová等人便將研究聚焦於改良聊天機器人。

為了讓聊天機器人更具社交性,也希望能應用於高齡者們的生活情境,Machová等人 (2023) 收集了在Kaggle上的文本資料,訓練出了一個聊天機器人模型。不過,這個聊天機器人模型還以高齡者們的對話問答集以及情緒辨識模型作為修正回話的基礎,所以它能夠說出對高齡者們而言更得體的話,同時也照顧到他們的情緒。

更進一步的,這個聊天機器人也導入到網頁應用程式中,Machová等人 (2023) 使用了Python的Flask架構,製作了網頁應用程式,如此一來,可以更好地串接機器學習模型以及人機互動介面,而圖形化使用者介面 (GUI) 則是使用Python的套件Tkinter來製作。

 

情緒辨識的準確率達到九成以上

Machová等人 (2023) 改造了Paul Eckman的六種基本情緒,定義聊天時常出現的情緒為快樂、悲傷、愛、恐懼、驚喜、憤怒,而經過他們反覆訓練模型的結果,使用CNN和RNN (LSTM) 這兩個模型所做的情緒分類表現是最好的。在他們的研究中,準確率 (accuracy) 可以達到91%。

這個具有9成以上準確率的情緒辨識模型導入到聊天機器人之後,也能有效的辨識對話內容的情緒,並且根據情緒與之交流。Machová等人 (2023) 在論文中也提供了一段聊天機器人與高齡者對話的例子,在那個對話例子中,總共有10處可供聊天機器人判斷情緒的句子,雖然其中有2處聊天機器人判斷情緒的結果稍有瑕疵,但仍然不影響對話輸出。整體而言,加入了情緒辨識之後,仍然能讓聊天機器人與高齡者建立更有效的對話。

 

文本存在多種情感時,對機器而言是個挑戰

如上所述,在研究中,儘管聊天機器人幾乎能因為情緒辨識而讓對話更具有同理心,但是人類在說話時,會在同樣的文本中夾雜的多種情感,所以情緒辨識模型也可能會出現模稜兩可的分類結果。此外,雖然聊天機器人可以作為與老年人交流的手段,但是在看似正向的文本中,辨識出其中隱藏著的負面情緒,對於機器人而言相當困難。因此,聊天機器人可以為老年人提供娛樂性的陪伴,但負面情緒的辨別仍是個具有挑戰性的課題。

研究者也提出,聊天機器人與人的溝通必須具有一定的敏感度,而且不應受意識形態控制和影響,這對於現今充滿負面能量的網路世界而言是相當重要的。所以聊天機器人和人類的互動,應該特別需要注意情緒的檢測,能更適當地提供更好的人機互動服務。

但是,Machová等人 (2023) 也提醒,目前研究仍然存在著對於情感方面的侷限性,文本中若有諷刺、成語、或是比喻等等,這種不按照字面意思解釋的語言,對於機器而言仍然相當難以理解。所以研究者建議,未來趨勢在於開發「多模態系統」即「不只處理文本,也能處理圖像和聲音」的系統,多方應用各種情緒辨識的科學方法,結合在同一個系統中時,對於自動情緒偵測這個領域而言或許會有更大的幫助。

 


參考文獻

  1. Machová, K., Szabóova, M., & Paralič, J, 2023, “Detection of emotion by text analysis using machine learning.”, Frontiers in Psychology, 14, 1190326.

 


✨延伸閱讀:《人類的情緒有幾種?六種還是六百種?

(Visited 62 times, 1 visits today)

分享至
views