音訊分離 - CASE 報科學

機器人：什麼？大聲點我聽不見！

2018 年 10 月 01 日2022 年 01 月 05 日 intern 語音辨識, 音訊分離, 音訊處理

人類有個與生俱來的能力：能在吵雜的環境中，分辨出哪句話是哪個人說的，並將不想關注的部份自動「消音」，降低訊息接收的錯誤率。現在，電腦也將具備這樣的能力。Google 新發表的音訊分離技術，藉由分析說話者口部動作影像與聲音特徵，辨別聲音是從誰的口中發出，進而將畫面中每個人物所說的話分離為獨立音軌。如此一來，智能助理也能在吵雜環境中，分辨出自己的使用者所下的指令。