【數位記憶】搶救瀕危資料大行動
■ 最近有一項搶救過去科學資料的全球性計畫正展開,打算把長期躲在抽屜跟地下室了無生氣的資料分門別類,重裝上陣。第一步可能是彙整那些以傳統攝影術拍成的天文學資料:它們的價值極高,卻分散各地,若無人悉心整理,可能在數位化浪潮中化為泡沫。
全球均有關鍵的科學資料面臨消失命運,有的存藏於脆弱、過時的媒體,有的是因為研究人員未能意識到它們的價值而無心摧毀。現在,一支科學家團隊正在計畫對博物館與研究機構進行清查,將全球瀕危的資料編成目錄。
國際組織「科學與科技資料委員會」(Committee on Data for Science and Technology)於南非史泰倫伯什舉行雙年會後,今年十月二十九日啟動這項計畫,目標是在二○一二年時將完整的目錄公布上網。
這份努力有助於未來拯救計畫次第開展時,作為輕重緩急的依據,例如氣候變遷研究,動轍可能需要溯及數位紀錄之前的資料,科學家常須翻找舊誌,從以 前的天氣型態尋找線索。
不光是舊書、舊照片岌岌可危。一九五○至一九八○年代的數位資料也處於告急狀態。這些資料儲存於過時的媒體,如磁帶、軟碟等,它們仍有毀損之虞,終至無法存取。開發中國家存在許多最珍貴的資料,從土地利用至疾病統計數字不一而足。不過,舊資料的最大威脅,應是內戰、不恰當與零碎的儲存。工作小組將透過直接詢問科學家,利用電子郵件、電話了解他們地下室內的現有資料。
三百萬塊玻璃板
契爾頓英國大氣資料中心的管理經理派普勒(Sam Pepler)認為,「科學與科技資料委員會」的計畫值得一試。他指出,長期且準確紀錄資料不是數位時代的新發明,其實大多數的資料遺產是以類比型式貯存,它早已有數百年歷史,許多舊資料已獲得系統性的留存,等待後人使用。
將舊資料編成目錄,是加拿大國家研究院赫茲伯格天文物理學研究所天文學家葛瑞芬(Elizabeth Griffin)與奧斯汀德州大學資訊專家兼《資料科學》期刊編審安德森(William Anderson)的點子。兩人都是十二人工作小組成員。
最近以大量非數位資料從事研究的葛瑞芬說,目前的狀況是,研究人員對其領域的非數位資料典藏,僅有模糊概念。從一些記錄天文光譜的舊玻璃板,她才能夠對地球大氣臭氧濃度的古今變化進行研究。她說她必須拎著手提箱,從一個天文台到另一個天文台,尋找這些玻璃板與書籍。她估計,被擺放在天文台地下室中吃灰塵,上面存有夜空珍貴資料的玻璃板,全球約有三百萬塊。她說,每片玻璃板皆是無法再重現的一扇歷史之門。
有些領域已著手恢復舊資料的行動。「全球海洋資料考古與拯救計畫」即是一例。一九九三年迄今,這項計畫已收集逾三百五十萬份海洋溫度的相關檔案,有些可以上溯超過一百年時間。話雖如此,不是多數領域皆有系統性的挽救資料計畫,因此也不是所有瀕危資料,均能獲得搶救,遺留後世子孫。在數位資料開始以拍位元組(petabyte,1015位元組)為計算單位的現代,科學組織光是應付來自不同計畫的大量資料已應接不暇,很難再有餘裕整理舊資料。
不過,安德森認為,唯有清楚知道舊資料的下落,方能在去蕪存菁上作出理性選擇。有些資料勢必會遺失,但至少是在經過選擇,或搶救不成後才發生。
圖片出處:Palomar Skies
原載於【知識通訊評論月刊九十八期】2010.12.01 網誌好讀版 by MissZoe