從分析到創作——談人工智慧應用於音樂的想像與真實

2018 年 10 月 26 日2022 年 01 月 04 日 intern 機器創作, 音樂

分享至

講者／蘇黎（中研院資訊科學研究所助研究員）│彙整／《科學人》編輯團隊
轉載自2018.03.11〈科創講堂．AI人工智慧〉

從聆聽、演奏、評論到作曲

人工智慧在音樂上可以做什麼？中央研究院資訊科學研究所助研究員蘇黎說：「希望機器具備如音樂家一般理解音樂的能力。」大致可以分為四個面向：聆聽、演奏、評論、創作。

在聆聽方面，相傳莫札特年少時聽到教堂音樂，回去後就能默記全曲並寫成樂譜，現在，人工智慧也做得到，這種技術稱為「自動採譜技術」。首先把物理的聲音訊號轉換成數學模式後，透過人工智慧技術，就能輸出MIDI（樂器數位介面），其中記錄了時間、音符、音高、聲部、樂器等資訊，最後再轉成人類熟悉的樂譜。

自動採譜技術對於很多口耳相傳卻沒有樂譜的音樂來說，有很大的幫助，它還能夠記下許多現場演奏者的音樂特徵，例如歌手的抖音習慣。

蘇黎以他所研究的布農族八部合音為例，它有很多與西方古典音樂不同的特徵，像是有很多聲部；還有微分音，一般鋼琴有十二個音階，微分音的音程在半音以下；以及泛音唱法，透過聲帶、頭部共振，一個人可以唱出兩個音調。運用自動採譜技術，人工智慧做出來的結果，與民族音樂專家的結果相符。

除了聆聽，人工智慧還可以演奏，即時偵測現在演奏到哪裡，跟上人類演奏者的節拍。也可以校正人類演唱者的音高，卻又保留演唱者的風格，而不會感到不自然，就是「走音救星」。最後還能作曲、編曲，例如，類似把圖片轉換成梵谷風的風格轉換技術，人工智慧也可以把月光奏鳴曲轉成巴哈風格。

不過，人工智慧在音樂領域上的應用有其困難。人工智慧系統包含的要素有資料（輸入）、標記（輸出）、類神經網路和目標函數。目前最缺的就是「考古題」，即使有資料，卻沒有標記。在音樂領域尤其難，例如小提琴大師海飛茲的獨奏，雖然有歷史錄音，但也要有人去做標記後才能訓練，但標記很費時間且需要高度專業人才。

人工智慧的價值

自從人工智慧出現，特別是學會創作以後，人類似乎就產生了焦慮感。蘇黎把此類比為「藝術創作天動說」：以往可能認為，人類才是藝術創作的中心，機器創作會毀壞藝術價值，這種衝擊就好像人類一直以為地球是宇宙中心，卻發現地球其實是繞著太陽運行的。另外，也有人認為機器不會累，可以源源不斷地創作音樂或做其他工作，就像是工業革命時人們所擔心的「永動機」，害怕工作被機器搶走，人類被機器取代。

蘇黎指出，人工智慧的創作是模仿人類神經元迴路，但在創作過程中，人類大腦到底是如何運作的，其實我們不知道。就像物理學家費曼提出的「草包族科學」（cargo cult science），二戰後一些原始部落為了吸引運輸機補給，試圖建造一座外表看似機場、實際上卻沒有機場功能的設施，以吸引飛機降落。

因此，人工智慧真的會取代或毀壞某些價值嗎？至少目前不會。蘇黎說：「研究人工智慧技術不是要取代或毀壞，而是做為一種工具。」運用人工智慧這種工具，可以讓繁雜的工作自動化以節省時間，專家就有更多時間去創作，或去做更多有價值的事情。

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)

(Visited 122 times, 1 visits today)

分享至

views