機器學習的量子力學方法

分享至

機器學習的量子力學方法

史丹佛大學應用物理系博士班 陳奕廷

略懂人工智慧

AI能針對外界的輸入給出適當的反應,例如分辨影像、玩遊戲、下棋和預測未來。圖1A是一個簡單的模型,針對輸入X,AI透過一個函數給出反應Y。這個函數由兩個參數a0和a1決定。如圖1B所示,不同的a0和a1有不同的錯誤率。通常人們在講「訓練人工智慧」或是「機器學習」,指的就是透過大數據,在各種參數組合中找出一組錯誤率最低的a0和a1。對於現實生活中有用的AI,輸入往往非常複雜,例如一段錄音、一張照片等(圖1C)。複雜的輸入需要複雜的函數來處理,通常有成千上萬個參數。這個複雜的函數通常被稱作「人工神經網路」,訓練起來非常耗時。就算用了最先進的圖形處理器(GPU)計算,尋找最佳解通常還是要花上一天甚至一個禮拜。快速尋找最佳解正是量子電腦可以下手的地方。

圖1、A: 簡單的AI模型。B: 不同的參數對人工智慧的錯誤率的影響。圖中越低點代表AI預測值和正確答案差異越小,代表AI的錯誤率越低。C:複雜的AI模型。

量子退火法和D-Wave

退火法是尋找最佳解的一種方法。具體作法是:準備一個粒子,讓它的能量函數和錯誤率函數一樣。當降低粒子的溫度時,由於物質傾向往能量低的方向走,最終粒子會達到能量最低點,也就是錯誤率函數最低的狀態。讀取粒子的狀態,我們就能得知最佳解。「退火」這個名稱來自材料科學,將金屬加熱到高溫再退火降溫會讓金屬的硬度提高,於是退火變成降低溫度的代名詞。在複雜的錯誤率函數中,退火法只能找到局部最佳解。如圖2A所示,粒子因為退火法被卡在一個次佳解。因為溫度已經降低了,無法越過屏障到達最佳解。但如果這個系統是一個量子力學系統,卡在次佳解的粒子可以透過量子穿隧效應越過屏障到達最佳解(圖2B)。

透過這樣的量子退火原理,量子電腦可以比古典電腦更有效率的找到最佳解。換句話說,訓練AI的速度會大幅提升。以量子退火法聞名的公司是加拿大的D-Wave。雖然因為一些執行的細節,D-Wave是否真的利用量子原理加速計算效率仍然備受爭議,但量子退火法本身是經過檢驗並值得期待的。

圖2、A:古典退火法。B: 量子退火法。

量子梯度法和以邏輯閘為基礎的量子電腦

另一種尋找最佳解的方法是梯度法,它被廣泛應用在人工智慧和機器學習中。具體作法是:如圖3A,從一個點開始,計算這個點的梯度(圖3A中的紅色箭頭),沿著梯度走到下一個點。重複這個步驟,最終就會走到一個最佳解。在複雜的應用中,計算梯度是非常耗時的,而量子電腦可以加速這個過程。圖3B是用量子方法計算梯度的簡化圖。簡單來說,把AI的錯誤率函數轉換為量子位元波函數的相位。相位是一種波動的特性,由於量子電腦特別擅長處理波動性,它可以有效率地計算錯誤率函數的梯度。如果一個AI總共有一萬個參數,古典電腦需要一萬次的計算才能得到梯度。相較之下,量子電腦只需要一次的計算,大幅減少計算成本。

這個計算梯度的量子演算法需要以邏輯閘為基礎的量子電腦來執行。比較知名的公司有:美國加州的Google、美國紐約的IBM和美國加州的Rigette。這些公司的量子電腦以超導電路組成,是目前被認為最成熟的量子電腦科技。一般認為,當量子電腦有超過50個位元,將比世界上任何古典電腦還強。目前這些公司的量子位元數目差不多都達到這個標準,但是其計算能力還在持續驗證中。另外一種以邏輯閘為基礎的公司是美國馬里蘭州的IonQ,其量子電腦以離子井組成。離子井的優點是一個量子位元是一個原子,所以量子位元間的幾乎沒有差異(原子都是一樣的),但製作大型電路有困難。超導電路的優點是可以透過半導體製程技術大規模量產,但是量子位元的品質參差不齊。無論是人工智慧還是量子電腦都是當今重點領域,它們的結合更是令人期待,其發展值得持續關注。

圖3、A: 梯度法式意圖。B:用量子演算法計算梯度的概念圖。


參考文獻:

  • Elizabeth Gibney, D-Wave upgrade: How scientists are using the world’s most controversial quantum computer, Nature (2017)
  • Mohammad H. Amin et al., Quantum Boltzmann Machine, Phys. Rev. X 8, 021050 (2018)
  • 特色圖片:Google今年推出的量子處理器,包含72個量子位元。它的名字叫做Bristlecone(狐尾松),因為量子位元間的拓樸結構和狐尾松的毬果外貌相似。(Source: Google AI Blog)
(Visited 143 times, 1 visits today)

分享至
views