【數位新知】影片也有DNA

■ DNA定序正夯,我們不妨也幫影片做個DNA定序。聽起來很玄?說穿了其實就是把原本影片中內含的二維資訊轉成一維的字串,再用生物資訊學中舉足輕重的LCS(Longest Common Sequence,最大公共子序列)演算法尋找相符的字串,一切就迎刃而解。

影片基因
如何建立視覺DNA:從影片中抓取出框架特性,進入散列的資訊庫之中。圖示的影片段落可以被轉譯為以下這串64位元的二進位數字:223E9DF01ADB3E00

翻譯 ∣ 葉房蒲

  認為有機體才具備基因組嗎?以色列科技理工學院(Israel Institute of Technology)的研究者正在為「錄像基因體」(Video Genome)定序,試圖藉此打擊網路上猖獗的影片盜版。

  透過偵測出那些在一般色彩及解析度操作下不太會改變的影像特徵,這項新技術得以實行。而當前的技術使用的是動作識別演算法(action recognition algorithms),藉由影片中的動作比對錄像序列。

  想像一下這三個樣本片段:原版星際大戰中光劍大戰的場面、同一片段在電視上播放的低畫質版本、以及你和你弟手持塑膠玩具重演的家庭影片。動作識別演算法會將三個片段判斷為是相似的,但錄像基因體分析只會把前二者歸為同一類。

麥克布朗斯坦
以色列電腦科學家麥可布朗斯坦

  亞力山卓‧布朗斯坦與麥可‧布朗斯坦兩兄弟(Alexander and Michael Bronstein)跟齊美爾(Ron Kimmel)借用生物資訊領域基因序列的配對與比對演算法(gene-sequence matching and alignment algorithms),成功做出前段所述的區別。他們的研究在今年3月27日發表於ArXiv.org

  麥可說:「我們發現分析錄像的諸多問題恰與序列分析中的應用及問題相吻合。」

  這項技術基於一個想法—影像的剪接編輯有似於DNA突變。影片即使添加廣告、刪去一些場景,甚至更改顏色或解析度,透過生物資訊學,我們仍能使用跟生物DNA序列同樣的方法比對影片的「DNA」。

  「即使是一小段影片,我們也能辨識出處,不受影片後製的影響。」亞力山卓表示。

  比方說,持攝影機盜錄戲院中播映的電影時,鏡頭可能會搖晃不定,色度、解析度也會改變,但錄像DNA序列仍然相似。

  影片的特徵被翻譯成一串資訊,正如同基因體被解讀為一串DNA核苷酸序列。錄像基因體由一組包括界線與形狀的特徵組成,同樣地搜尋演算法也是利用一組文字去找出文本間的相似處。而這些影像特徵在一般的操作編輯之下並不會改變。

  「你可以把一段影片可能經歷過的修改想成類似突變。」麥可表示。舉例來說,廣告就像嵌入突變(insertion mutation),因為收視率而刪減的片段則類同缺失突變(deletion mutation)。

  每一個畫面中影像特徵的重複率被圖解翻譯成一個64位元二進位字串。隨著這些資訊播放,該影片的錄像基因體可以比擬作一個使用生物資訊分析的資料庫。錄像基因體僅佔DVD品質錄像約百萬分之一的頻寬,而且可以被即時翻譯。

  這項科技或許可以被用於偵測YouTube上的侵權內容,或是將元數據(metadata),譬如字幕、使用者註記或評論等等配對至與任何版本相對應的影片。理論上,數千小時的錄像序列幾天內即可處理完,比對的準確度高於99%。

?

原文出處:Wired Science

?

責任編輯:MissZoe、Taroa
分享到facebook

3,746 人瀏覽過

2 thoughts on “【數位新知】影片也有DNA

  • 2011 年 09 月 23 日 at 01:56:34
    Permalink

    太神奇了!

    Reply
  • 2011 年 10 月 03 日 at 15:58:20
    Permalink

    原來影片也有DNA的

    Reply

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

為了避免你是機器人,請在留言前回答以下問題: