機器人:什麼?大聲點我聽不見!

人類有個與生俱來的能力:能在吵雜的環境中,分辨出哪句話是哪個人說的,並將不想關注的部份自動「消音」,降低訊息接收的錯誤率。現在,電腦也將具備這樣的能力。Google 新發表的音訊分離技術,藉由分析說話者口部動作影像與聲音特徵,辨別聲音是從誰的口中發出,進而將畫面中每個人物所說的話分離為獨立音軌。如此一來,智能助理也能在吵雜環境中,分辨出自己的使用者所下的指令。

Read more