從分析到創作——談人工智慧應用於音樂的想像與真實
講者/蘇黎(中研院資訊科學研究所助研究員)│彙整/《科學人》編輯團隊
轉載自2018.03.11〈科創講堂.AI人工智慧〉
從聆聽、演奏、評論到作曲
人工智慧在音樂上可以做什麼?中央研究院資訊科學研究所助研究員蘇黎說:「希望機器具備如音樂家一般理解音樂的能力。」大致可以分為四個面向:聆聽、演奏、評論、創作。
在聆聽方面,相傳莫札特年少時聽到教堂音樂,回去後就能默記全曲並寫成樂譜,現在,人工智慧也做得到,這種技術稱為「自動採譜技術」。首先把物理的聲音訊號轉換成數學模式後,透過人工智慧技術,就能輸出MIDI(樂器數位介面),其中記錄了時間、音符、音高、聲部、樂器等資訊,最後再轉成人類熟悉的樂譜。
自動採譜技術對於很多口耳相傳卻沒有樂譜的音樂來說,有很大的幫助,它還能夠記下許多現場演奏者的音樂特徵,例如歌手的抖音習慣。
蘇黎以他所研究的布農族八部合音為例,它有很多與西方古典音樂不同的特徵,像是有很多聲部;還有微分音,一般鋼琴有十二個音階,微分音的音程在半音以下;以及泛音唱法,透過聲帶、頭部共振,一個人可以唱出兩個音調。運用自動採譜技術,人工智慧做出來的結果,與民族音樂專家的結果相符。
除了聆聽,人工智慧還可以演奏,即時偵測現在演奏到哪裡,跟上人類演奏者的節拍。也可以校正人類演唱者的音高,卻又保留演唱者的風格,而不會感到不自然,就是「走音救星」。最後還能作曲、編曲,例如,類似把圖片轉換成梵谷風的風格轉換技術,人工智慧也可以把月光奏鳴曲轉成巴哈風格。
不過,人工智慧在音樂領域上的應用有其困難。人工智慧系統包含的要素有資料(輸入)、標記(輸出)、類神經網路和目標函數。目前最缺的就是「考古題」,即使有資料,卻沒有標記。在音樂領域尤其難,例如小提琴大師海飛茲的獨奏,雖然有歷史錄音,但也要有人去做標記後才能訓練,但標記很費時間且需要高度專業人才。
人工智慧的價值
自從人工智慧出現,特別是學會創作以後,人類似乎就產生了焦慮感。蘇黎把此類比為「藝術創作天動說」:以往可能認為,人類才是藝術創作的中心,機器創作會毀壞藝術價值,這種衝擊就好像人類一直以為地球是宇宙中心,卻發現地球其實是繞著太陽運行的。另外,也有人認為機器不會累,可以源源不斷地創作音樂或做其他工作,就像是工業革命時人們所擔心的「永動機」,害怕工作被機器搶走,人類被機器取代。
蘇黎指出,人工智慧的創作是模仿人類神經元迴路,但在創作過程中,人類大腦到底是如何運作的,其實我們不知道。就像物理學家費曼提出的「草包族科學」(cargo cult science),二戰後一些原始部落為了吸引運輸機補給,試圖建造一座外表看似機場、實際上卻沒有機場功能的設施,以吸引飛機降落。
因此,人工智慧真的會取代或毀壞某些價值嗎?至少目前不會。蘇黎說:「研究人工智慧技術不是要取代或毀壞,而是做為一種工具。」運用人工智慧這種工具,可以讓繁雜的工作自動化以節省時間,專家就有更多時間去創作,或去做更多有價值的事情。
(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)