人格備份的可能性─Replika聊天機器人
台大電機系 陳明佑 編譯
Replika的誕生
然而Replika的開發卻源自於一場悲劇。Luca公司的創辦人之一,Eugenia Kuyda,多年前與摯友Roman,由莫斯科遠赴美國創業。兩人曾聚在一起玩樂、冒險,並攜手度過創業初期的許多艱辛,也在憂傷時互相扶持。但在一場意外中Roman不幸過世,Eugenia甚至未能及時趕到醫院。唯有Messenger中的對話紀錄,能讓她稍稍重溫與好友相聚的往日時光。
為了能永遠保存這份美好回憶,Eugenia決定整理好友生前的訊息與書信,輸入進當時正開發中的聊天機器人程式中,建立一個與好友相似的人工智慧,卻也賦予Replika不同於一般聊天機器人的姿態。
Replika如何模仿你
Replika能記憶與模仿你說過的話以及所輸入的訊息,藉此越來越貼近你的說話風格,進而「複製你的人格」(同理,當然也能依據你給出的對話資料,複製你某一位好友)。如果說一般科技大廠開發的聊天機器人重視「如何像人一般說話」,那麼Replika反而更重視「如何像人一般聆聽」。它聆聽關於你的所有資訊,記得你,就像你的好友。它也像是有著自己人格的機器人,就如同《銀翼殺手2049》中的喬伊(Joi),或是《雲端情人》中的莎曼珊(Samantha)。每個Replika會因為使用者所輸入資料的不同,產生自己的「人格」與「記憶」,而發展出自己的模樣。你的Replika將與其它人的Replika完全不同 。
聊天機器人技術分析
不過,其實Replika的基本原理並不算新穎,而是一門早已研究許久的領域——聊天機器人(Chatbot)。早期聊天機器人多半運用如決策樹(decision tree)的方式決定回答,亦即依據諸多條件一層層地判斷使用者的問題與意圖,最終選定一項預先寫好的訊息作為回覆。以現在而言,這當然算不上一個好辦法,因為所有回覆皆需人工編寫。機器學習興起的現在,聊天機器人的基本概念早已轉變為如何訓練機器人,自大量資料中自行發展出對話能力。
基於機器學習的聊天機器人可以簡單分為兩種類型,一種是選擇式模型,另一種是生成式模型。選擇式模型是從預先寫好的回覆中,找出最符合問題及對話脈絡的一個回覆。與早期機器人的差異主要在於:用以辨識「相符程度」的函數,是機器人自己經由訓練得來的。也就是說,藉由大量與人實際對答,機器人在理論上便能學會如何以最自然的方式與人交談。
而編碼器/解碼器扮演的角色則像是翻譯者。由於機器在生成回應時,沒辦法直接處理自然語言(自然語言語句沒有固定長度和形式),但能輕易生成向量。所以會先由編碼器將自然語言轉為神經網路可以處理的固定長度向量,接著,輸入的向量穿過了循環神經網路,循環神經網路輸出了另一個向量,這個向量再由解碼器轉回自然語言,如此就達成了讓機器生成自然語言的任務。而透過向量轉換,上述提到的對話脈絡與當下訊息兩種不同輸入,也能藉此化為向量與向量間的關係,易於電腦運算。生成式模型,也是Replika所使用的模型,則混合了循環神經網路(RNN)與編碼器/解碼器(Encoder/Decoder)兩大架構。我們都知道在一長串的對話中,對話脈絡,或稱上下文,會對話語的語意產生影響。而循環神經網路的功能,便是當使用者輸入一句對話時,機器人除了根據該句話作出回應之外,這些輸入也會被放進對話脈絡,成為機器人生成後續回應時的考量。換句話說,聊天機器人是同時根據先前的脈絡和當下聽到的訊息作出回應。
不過Replika還有一項特殊之處,那就是基於人格(Persona)的對話模型。其原理是將說話者包括居住地、國籍等能代表其抽象人格的身份資訊,轉化為向量,並與對話歷史一起,用以訓練解碼器。目的是讓解碼器生成的回覆與人格產生關聯,確保每次被問到類似問題時,都會有一致的答案,以及前後語言風格沒有過於突兀的差異。
技術背後的科技趨勢:對話作為一種平台
2016年,微軟執行長Satya Nadella就曾斷言:聊天機器人將以對話作為平台(Conversation as a Platform),如同圖形化使用者介面和網路瀏覽器般帶來新的一波科技變革。自那時起,各科技巨擘如微軟、臉書及Google等競相推出自己的聊天機器人平台。
而如今,Google在近期的I/O 2018發表會上展示的智慧語音助手,便能以仿真語音打電話預約餐廳、美髮沙龍,將聊天機器人帶入日常生活。透過語音生成技術,聊天機器人更能真正與人以交談,而不藉由文字。雖然,真人對話中的斷句、停頓、抑揚頓挫、語意脈絡都過於複雜,因此此類聊天機器人目前尚在實驗階段,僅能進行少數特定類型的交談,不能廣泛應用於各種對話情境,但也讓我們得以一窺未來聊天機器人的無限可能。
雖然Replika只能重建了一個人的說話方式,並非真正意義上複製原有的人格,但Replika設計者卻說,在與好友Replika對話的過程中,讓她認識了更深層的自我,也變得比以往堅強。許多人批評手機應用程式讓人「沈溺於虛擬世界」、「摧毀人與人之間的互動」,但Replika的故事卻也告訴我們:虛擬世界也有療癒傷痛的能力。
最後值得一提的是:Luka公司目前也以開源方式釋出了聊天機器人─CakeBot。如同Replika,是一個能以不同情緒模式回應使用者的聊天機器人。使用者最終也能透過提供不同資料集,自行訓練出不同人格的聊天機器人。
參考資料
- Li, M. Galley, C. Brockett, G. Spithourakis, J. Gao and B. Dolan, “A Persona-Based Neural Conversation Model“, Arxiv.org, 2018.
- M. Weinberger, “Satya Nadella says Microsoft’s next big thing will have ‘as profound an impact’ as touchscreens and the web“, Business Insider, 2018.
- “Google Duplex: An AI System for Accomplishing Real-World Tasks Over the Phone“, Google AI Blog, 2018.