【數位新知】影片也有DNA
■ DNA定序正夯,我們不妨也幫影片做個DNA定序。聽起來很玄?說穿了其實就是把原本影片中內含的二維資訊轉成一維的字串,再用生物資訊學中舉足輕重的LCS(Longest Common Sequence,最大公共子序列)演算法尋找相符的字串,一切就迎刃而解。
翻譯 ∣ 葉房蒲
認為有機體才具備基因組嗎?以色列科技理工學院(Israel Institute of Technology)的研究者正在為「錄像基因體」(Video Genome)定序,試圖藉此打擊網路上猖獗的影片盜版。
透過偵測出那些在一般色彩及解析度操作下不太會改變的影像特徵,這項新技術得以實行。而當前的技術使用的是動作識別演算法(action recognition algorithms),藉由影片中的動作比對錄像序列。
想像一下這三個樣本片段:原版星際大戰中光劍大戰的場面、同一片段在電視上播放的低畫質版本、以及你和你弟手持塑膠玩具重演的家庭影片。動作識別演算法會將三個片段判斷為是相似的,但錄像基因體分析只會把前二者歸為同一類。
亞力山卓‧布朗斯坦與麥可‧布朗斯坦兩兄弟(Alexander and Michael Bronstein)跟齊美爾(Ron Kimmel)借用生物資訊領域基因序列的配對與比對演算法(gene-sequence matching and alignment algorithms),成功做出前段所述的區別。他們的研究在今年3月27日發表於ArXiv.org。
麥可說:「我們發現分析錄像的諸多問題恰與序列分析中的應用及問題相吻合。」
這項技術基於一個想法—影像的剪接編輯有似於DNA突變。影片即使添加廣告、刪去一些場景,甚至更改顏色或解析度,透過生物資訊學,我們仍能使用跟生物DNA序列同樣的方法比對影片的「DNA」。
「即使是一小段影片,我們也能辨識出處,不受影片後製的影響。」亞力山卓表示。
比方說,持攝影機盜錄戲院中播映的電影時,鏡頭可能會搖晃不定,色度、解析度也會改變,但錄像DNA序列仍然相似。
影片的特徵被翻譯成一串資訊,正如同基因體被解讀為一串DNA核苷酸序列。錄像基因體由一組包括界線與形狀的特徵組成,同樣地搜尋演算法也是利用一組文字去找出文本間的相似處。而這些影像特徵在一般的操作編輯之下並不會改變。
「你可以把一段影片可能經歷過的修改想成類似突變。」麥可表示。舉例來說,廣告就像嵌入突變(insertion mutation),因為收視率而刪減的片段則類同缺失突變(deletion mutation)。
每一個畫面中影像特徵的重複率被圖解翻譯成一個64位元二進位字串。隨著這些資訊播放,該影片的錄像基因體可以比擬作一個使用生物資訊分析的資料庫。錄像基因體僅佔DVD品質錄像約百萬分之一的頻寬,而且可以被即時翻譯。
這項科技或許可以被用於偵測YouTube上的侵權內容,或是將元數據(metadata),譬如字幕、使用者註記或評論等等配對至與任何版本相對應的影片。理論上,數千小時的錄像序列幾天內即可處理完,比對的準確度高於99%。
?
原文出處:Wired Science
?
責任編輯:MissZoe、Taroa
分享到facebook
太神奇了!
原來影片也有DNA的