基因區塊鏈:使用區塊鏈幫個人基因組上鎖

圖片來源By HOTLITTLEPOTATO, https://www.wired.com/story/solve-genomics-with-blockchain/

撰文|黃佳欣

人類基因組於2003年首次完成定序,解碼第一套人類的基因藍圖,成本約為30億美元。接下來的十多年中,定序技術大幅進步,在2017年,一個人類基因組定序成本已經降至約1,000美元[1]。未來,定序成本還會更便宜,針對大眾消費者的基因定序服務將會更加普及。

當今的醫療保健體系,最主要的一個挑戰是每個醫院或醫療相關單位基本上是無法相互溝通的數據孤島,其中包括基因組和其他醫療數據在內的有用資訊仍然掌握在收集這些資料的組織手中。然而,個人醫療數據所有者並沒有擁有對這些數據的使用方式保留完全的所有權或控制權。

最新一篇發表於Genome Research期刊的論文,介紹當前使用區塊鏈來解決基因體學發展過程的問題,並提供區塊鏈技術對生命科學可能的未來影響及展望。

●基因的大數據煩惱

定序人類基因組帶來了電腦運算負載量以及後續數據的隱私和所有權的問題。基因定序需要大量的計算資源,高昂費用限制執行定序產業的普及。此外,定序分析的結果大都是集中保存在所屬機構的資料庫,根據該機構的規定得以有限制性的取用,或是使用標準檔案傳輸協議來進行資料的交換與使用。這樣通常會引發兩個問題:第一,集中管理機構成為數據的守門人,實際上是基因資料與提供者之間不必要的中介;第二,該機構發生故障的風險,甚至會遭受惡意竊取個人的隱私資料。

理想情況下,基因資料的提供者應能夠直接或通過受信任的第三方(例如具有必要許可和道德委員會批准的醫生或研究單位)來控制。因此,需要具備安全且去中心化的平台,讓用戶可直接來管理自己的基因組數據。從廣義上來說,區塊鏈技術可以實現分散的,不可改變的,不可摧毀的公共帳本(public ledgers),有助於改善基因組數據的分析與存取問題。

●區塊鏈人包

區塊鏈(blockchain)技術是像比特幣這類數位貨幣的底層技術,它是一種分散形式資料庫,其中數據(或貨幣)安全地存儲在全世界的數萬台電腦中,而不是像銀行這樣的集中式機構。存儲在區塊鏈中的數據可以被檢視和共享,而沒有操縱或信息丟失的風險。因為區塊鏈上的各區塊(block)或稱作帳本資訊是採用階流加密(Cascaded encryption)的方式,也就是前一個區塊的加密結果都會疊加到目前的區塊上,同時搭配時間的紀錄進去每個新區塊中,按照時間順序可以串連起每個區塊組成一條所謂的區塊鏈。因此,想要篡改區塊的內容,必須把整條鏈上面每個區塊的帳本資訊都進行修改與驗證,是需要控制整個網路上過半的電腦運算能力才可能成功地攻擊區塊鏈。

舉個當前大家較為熟悉的臉書為例,隨著臉書頁面不斷地更新動態,每一項動態就像是一個區塊,這些資訊基本上都是完全公開透明,每分每秒累積的動態就像是專屬你的個人臉書區塊鏈,想要塗改你過去某時間的動態,將需要連帶之後的動態都同步修改。區塊鏈的技術透過詳細記錄過程與共識加密演算法,使區塊鏈的運作機制提供了近乎不可塗改的特性,可以讓各個領域的資訊都放在各自的區塊鏈上。

●區塊鏈於基因組定序的

這篇論文主要介紹了區塊鏈的數個應用實例,以及相應的提案項目或潛在的使用領域。包括分散式運算(distributed computation),數據存儲與分散式整合用戶協議(data storage and distribution voting),個人身份和數據所有權通過區塊鏈進行驗證(identity and ownership)。

隨著基因組定序的樣本數大量增加,或對新版的參考基因組(reference genome)進行再分析,運算效能的問題就更加明顯,對於醫療或研究機構是越來越大的計算負擔。目前已經有數個公司與提案利用區塊鏈「挖礦」,施行分散式運算來進行基因組的序列組裝與註解,如Gridcoin,Curecoin和FoldingCoin等公司。

資料共享向來就是科學發展的重要基石,開放取用個人基因資料,再進行分析以擷取更多有用的資訊;但是要同時保護個人隱私,並符合政策規範是很重要且高度挑戰的問題。其中,Filecoin 是分散式網絡存儲的一個操作實例。而 Nebula Genomics,提供免費的平台讓用戶可通過區塊鏈技術安全地把基因組資料“租”給製藥廠商使用,甚至換取電子貨幣(Nebula tokens)。其他公司如Zenome, Gene-chain也採用區塊鏈技術讓用戶真正擁有自己的數據。

總括來說,區塊鏈技術期望透過全球的計算資源,以較低的成本完成定序服務,並且使用私密金鑰的演算法規避法規在個人基因資料的使用問題,同時保有個人的隱私權。雖然區塊鏈不是解決巨量基因組數據的萬靈丹,可以期待的是區塊鏈仍然還有更多應用跟開發的空間。

 

參考資料:

  1. 原始論文:Ozercan H.I. et al. Realizing the potential of blockchain technologies in genomics. Genome Res. 2018. 28: 1255-1263. doi: 10.1101/gr.207464.116
  2. DNA Sequencing Costs: Data

--
作者:黃佳欣,
臺灣大學昆蟲學博士。現為中央研究院資訊科學所博士後研究員。過去以昆蟲生理及腸道菌共生關係為研究主題,目前聚焦於生物資訊與功能性基因體學。

 

加入好友

人瀏覽過