從一張2D影像直接建構3D資訊

■面對一張影像,我們「得到」的比起我們實際「看到」的豐富許多。我們的大腦在理解影像時,會將常識應用在其中,解讀影像沒有包含的部分。例如:看到桌子的三隻腳,我們能推論出被擋住的第四隻腳的形狀和顏色。要訓練人工系統達到相同的空間認知能力,需要大量手工標記的數據。對此,DeepMind公司近日發展一種人工智慧,能蒐集數據並訓練自己,突破數據不足的限制。對於一張2D影像,它能建構出3D的空間資訊,並且對從未看過的場景做出正確的預測。

Read more