網路上的評價與留言到底準不準?
隨著消費者的消費習慣改變,越來越多人在購買東西之前會到網路上搜尋評價與留言,並根據這些數據決定是否消費。然而,這些網路評價與留言真的準嗎?從這項消費習慣漸漸興起,不少平臺與賣家就會聘請寫手專門撰寫虛假評論,或是放出「黑函」打擊競爭者。我們是否有辦法藉由AI來協助我們偵測出一則評價的真偽呢?
撰文|王冠云
相信不少人在買東西之前,往往都會先上網搜尋一下商品的評價,甚至也會去找不少開箱文,確實貨比三家之後才敢下手。網路上的商品評價會左右一個消費者的購買行為,甚至有公司為了打擊對手,而有所謂的「寫手門」事件。到底那些混淆視聽的評論有沒有辦法用AI來偵測出來呢?
所謂「假評論」的標準是什麼?
在尋找假評論之前,首先需要定義什麼是假評論。寫手們也不是省油的燈,要能辨識出真假可以說是相當考驗心理學家和語言學家。根據Jabeur等人 (2023) 的文獻回顧,學界們在研究這個問題時總共分成了五種假設。
- 真假評論難以區分。
- 浮濫的評論沒辦法像真實的評論一樣表達情感。
- 分析單一用戶的所有評論,將能從中辨識出異常行為。
- 評論內容、評論者行為和產品特徵應該具有一定的依存關係。
- 使用真實的評論所產生的典型模式來偵測出異常行為。
在過去的研究中,抱著不同的出發點來訓練AI模型辨識真假評論。至於訓練資料的選擇,除了從知名的網站Amazon或是跟餐旅有關的評論網Yelp之外,也有不少研究使用Ott等人在2011年所製作的評論資料庫,裡面的假評論是刻意聘用一群人撰寫而成。其他資料庫的真假訊息辨識中,真實的答案 (ground truth) 是透過該網站的垃圾訊息辨識來檢出,但Ott等人 (2011) 的資料庫則是刻意聘人撰寫,更能確定該資料庫中的假訊息是「真」的「假」訊息。
早期的研究由於抱持著真假評論難以區分的假設,因此研究焦點放在如何分辨評論「是否」為評論以及重複的評論;第二種假設則是認為假訊息粗製濫造,所以應該會有相似的情緒,而不會像真實評論一樣充滿各種情緒起伏;假設三則是透過個體用戶的行為分析來抓出異常;假設四則是透過觀察依存關係間的模式 (pattern) 來找出不合尋常的評論;抱持最後一種假設的研究,則是透過評分的數值分布來計算典型模式,以辨析出假評論。
「道高一尺,魔高一丈」假評論還是很難被抓出來
在這些研究的各種機器學習或深度學習演算法中,具有良好正確率的分類演算法包含支持向量機 (support vector machine)、卷積類神經網路 (convolutional neural network, CNN) 以及遞歸類神經網路 (recurrent neural network, RNN),不論使用哪一種模型來進行分類,大致上都是以文本本身的特徵來進行分析。
然而,儘管在假設的支持之下,能使這些模型的分類達到良好的正確率,但實際上這些AI目前都只建立在反應式 (responsive) 的方法上,也就是說,必須先有既定的訓練資料及測試資料使AI學習之後,才能實際使用。而且正因為使用既有的資料學習,所以往往只能應用在特定的平臺上,難以同時應用到多個平臺上。
除此之外,由於專業製造假評論的寫手仍然存在於各個平臺的背後,只要他們不斷地更新自己的寫作技巧,就有可能克服人工智慧的辨識,以假亂真。因此,也有學者認為,與其辨識出單一假評論用戶,直接尋找假評論集團,可能更容易發現某些文本上的共同特徵。
做個聰明的消費者
體認到目前AI還難以完美地辨識出假評論,Walther等人 (2023) 就透過消費者的角度,來瞭解聰明的消費者們都是怎麼抓出假評論的。以評論本身而言,極端的一星評論或五星評論通常被認為可信度較低,論證的說服力較低、過短或過長的評論也被認為可信度較低。另一方面,透過觀察評論者的特徵,也會影響到對於評論的可信度,若能看到該用戶的基本資料,例如年齡、性別等等,相對地該用戶所提供的評論也會被認為更具有可信度。
以上關於用戶及評論的文字本身觀察,真人和AI的出發點很相似,不過與機器不同的是,真人消費者在判斷評論真偽的時候,也會綜合考量賣家以及平臺的特性。如上所述,AI的學習資料庫往往只有評論的文本和用戶資料,而缺少了平臺本身或賣家有關的資料。以真人消費者而言,如果判斷賣家的商品是值得信任的,且具有一定的消費紀錄,那麼也會同步認為關於該商品的評論是較為可信的。除此之外,若是賣家只是在自家官網上展示網路評論,消費者也會認為那是被過濾過的而不具可信度。在購物平臺上,消費者也會先藉由瞭解該平臺是否會抵制假評論、假用戶,來決定自己是否應該信任那些評論。
總而言之,目前AI偵測假評論的技術仍然有待精進,而在開發AI工具之前,人類的智慧也是不可或缺。Walther等人 (2023) 在論文中寫到,目前從消費者的角度來探索真人究竟如何判斷假評論的研究量,相較於整個假訊息偵測的研究群體而言,僅僅只占了一小部分。而在他們的文獻回顧之後,或許接下來幾年又會有更新的技術來協助人類分辨網路評論的真假了,幫助消費者們聰明消費!
參考文獻
- Jabeur, S. B., Ballouk, H., Arfi, W. B., & Sahut, J. M., 2023, Artificial intelligence applications in fake review detection: Bibliometric analysis and future avenues for research. Journal of Business Research, 158, 113631.
- Ott, M., Choi, Y., Cardie, C., & Hancock, J. T., 2011, Finding deceptive opinion spam by any stretch of the imagination. arXiv preprint arXiv:1107.4557.
- Walther, M., Jakobi, T., Watson, S. J., & Stevens, G., 2023, A systematic literature review about the consumers’ side of fake review detection – Which cues do consumers use to determine the veracity of online user reviews? Computers in Human Behavior Reports, 10, 100278.