天下為公的數位資料

Print Friendly

天下為公的數位資料
知識通訊評論第76期

就數位研究共享架構而言,與其建置新入口網站,還不如公開標準化的資料。

資料的共用分享

科學家透過基因組學、感應器和其他科技創造了許多數位研究資料。數量之多,必須要有基礎建設才能使用、保存這些資料或另作他用。類似這樣的計畫已經展開,包括經費一億美元,為期五年的美國國家科學基金會 DataNet 計畫,以及歐洲永久近用聯盟 (Europe’s Alliance for Permanent Access)。但是政府和私部門之間的責任如何劃分呢?

去年十二月份一連串的事件顯示這個議題的複雜程度。其中一例就是亞馬遜書店的創新計畫:免費管理大筆科學資料,目前已有基因銀行( GenBank) 和其他廣受使用的基因序列和化學結構資料庫。

亞馬遜此舉並非完全沒有自身利益考量。雖然研究人員能夠下載資料到自己的電腦上,但該公司估計許多人會想使用「雲端計算」技術。這種技術能利用亞馬遜公司強大的伺服器架構來處理資料,而且是以隨用隨付方式計費。

這樣的服務讓研究人員受獲匪淺。亞馬遜在網路世界建立了科學資料的永久空間,如此能夠解決以往一些資料庫的問題,例如研究經費用罄而無法維護資料庫。雲端計算技術不僅能讓小型實驗室不用再負擔維持資料庫的成本,也能讓多樣的學術社群共享資料和分析工具。

然而同樣在去年十二月,另一件事也顯示了只倚賴某個公私立部門來建立這種架構的風險。Google 宣佈放棄先前計畫,不再免費管理大筆科學資料,顯然是受到景氣的波及。歐盟十一月與研究機構、圖書館和博物館合作推出 Europeana 線上數位圖書館,還大肆吹捧可以取代 Google Books。Europeana掃描了許多珍貴歷史文物,但是不到幾小時內部的運算架構當機,直到一個多月後才恢復正常。法國政府的Géoportail宣稱可以媲美Google Earth,二○○六年總統席哈克還為此大力宣傳,但也遭遇類似 Europeana 的情況。

「公開標準化的資料能夠鼓勵創新,享有更優質的資訊服務。」

政府透過類似的公共計畫來避免公司壟斷重要的文化及科學資產。但是太過強調建立自己的數位圖書館和資料庫,也可能忽略了其他也許更重要的解決方法。例如公開標準化的資料作為商業或非營利用途,能鼓勵創新,享有更優質的資訊服務。若要避免前述令人困窘的當機問題,公部門也可以考慮和像 Google 或亞馬遜之類的公司合作,充分利用他們的規模經濟和專長。

(本文原為二○○九年一月七日《自然》雜誌社論)

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *


1 + 3 =