看不見的機器人——社群網路背後的語意理解智慧

2021 年 11 月 09 日2022 年 01 月 04 日 intern 網路客服, 聊天機器人, 語音助理

分享至

講者／黃鐘揚（台大電機系教授）│彙整／《科學人》編輯團隊
轉載自2018.03.11〈科創講堂．AI人工智慧〉

雞同鴨講的對話

目前，能夠與人聊天互動、提供各種服務的軟體中，Siri最為人所熟知。許多人就以調戲Siri為樂，我們說一句話，Siri的回話可能令人啼笑皆非。黃鐘揚舉例，如果我們問「我死後，我的受益人有什麼權益？」它會擔心你自殺；若是問「我上個月出車禍，現在還來得及申請理賠嗎？」它會問你要找拖吊場、急診室、救護車，還是急救中心？如果我們的口音不標準，它會回答聽不懂。

這種牛頭不對馬嘴的機器人，雖然增添了許多樂趣，但如果用在客服部門，可能就幫倒忙了。想要變得實用，首先還是要能夠理解人類所說的話，才有可能做出相對應的服務。黃鐘揚指出，這當中最重要的技術就是「自然語意理解引擎」。

自然語意理解引擎

如何讓機器理解人類語言呢？一開始想到的方法可能是用關鍵字去窮舉，但是排列組合太多，不可能窮舉所有的規則，而且規則和規則之間可能還有衝突，所以此法不佳。黃鐘揚說，「現在技術大都用類神經網路，也就是深度學習」來處理。

所謂的類神經網路，是模擬大腦神經元運作方式所建立的數學模型。而自然語言理解引擎就是把上億句句子丟給一個類神經網路去學習，以非監督式學習的方式讓機器自行了解文字之間的關係，建立一個數學模型。有了這個數學模型，就算不知道文字的真正意義，也知道文字間是否有高度相關，例如：國王和皇后之間的相關性。把所有字、詞、句都轉成數學的高維向量，當我們問客服問題時，就用向量相似度去評估該問題在向量空間中最接近哪個問題。

如果事先把各類問題分類，每一個類別就會在這個很大的語意空間裡形成許多子空間，就可以在子空間裡尋找最相似、最接近的意思，由於不用在龐大的語意空間裡比對，準確率就會提高很多。也就是說，引擎知道字、詞、句之間的關係後，針對特定範圍，就可以用少量的訓練資料，達成高準確率。這種引擎具有舉一反三的能力，就連火星文也能懂。

比如我們問：「窩ㄉ森日優惠要ㄑ哪裡領？」（我的生日優惠要去哪裡領？）引擎會知道「窩」跟「我」、「ㄉ」跟「的」高度相關，森日優惠則最接近生日券，因此最後客服機器人就知道要回答與生日券相關的問題。

從弱AI到強AI

然而，黃鐘揚說：「嚴格來說，這些還只是弱AI，未來還有很多挑戰。」舉例來說，第二件五折，機器人得知道要先買第一件，第二件才能五折，機器人沒有這種常識和推論能力。另外，有些對話必須考慮前後文才能正確分辨字義，前後文的狀態如何儲存、使用，也都是一大難題。因此，想要讓機器人像人類一樣正常聊天，還是有很長的路要走。

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)

(Visited 178 times, 1 visits today)

分享至

views