【探索19-3】從基因之小 見生命之大:解碼DNA足跡
■本期探索講座第三講由于宏燦教授擔任主講人,于老師研究領域橫跨演化遺傳與基因體定序,本次演講除了以巧妙的比喻及生動口吻將基因定序發展脈絡娓娓道來外,也引領觀眾思考現今世界面臨之難題及運用基因體序列的可能因應之道。
講師|臺灣大學生命科學系教授 于宏燦
彙整撰文|陳雅婷
●基因內的結繩紀事
電腦以0與1的排列方式來儲存資訊,生物則是由最基本字元A、T、C、G四種鹼基記錄且決定遺傳特徵,透過排列組合的變化,形成各式指令進而合成蛋白質調控各種細胞和生物機能。而這樣的機制究竟有多精密?我們可以試著這麼想:如果將身上46條染色體的DNA從細胞中抽出,並將它們排列起來,計算後可達2-3公尺長,而這些「生命藍圖」的龐大密碼資訊必須緊密纏繞壓縮至在幾個微米的細胞核內;如果我們再進一步將全身細胞的DNA拉直計算,那可是相當於地球到太陽來回約70趟的長度。但幾百萬年來,生物卻得以透過這些龐大且精確的密碼紀事,將特徵代代相傳,並隨著時間演化,造就出地球生物圈的多變樣貌。
值得一提的是,如果我們進一步觀察各物種的染色體數目或DNA含量變化,科學家發現存在著「C值矛盾現象(C – value paradox)」。C值指的是什麼呢?其實就是真核生物細胞中,單倍體細胞核裡所擁有的DNA含量。科學家發現生物的C值(即基因組DNA的量)其實並不全然與生物複雜度呈完全正相關。例如:蕨類中名為瓶爾小草的植物染色體數目是2n>1,600,就遠超過人類的46條染色體。這些現象除了給科學家出了一道有趣的難題外,就另一層面而言,也顯示了生物天書所記載的指令,其變化和複雜度遠超過我們的想像。
●金鑰開啟篇章
雖然已知DNA記事是採用A、T、C、G四種基本字元,但基因序列又當如何排序?如果以實際文字與書本作為形容,一個人類基因組的DNA密碼字數,約由30億個文字組成,相當於75套大英百科全書,要將其正確破解,實非易事,吸引大量科學家絞盡腦汁投入和嘗試。其中,最大的躍進就屬1977 年英國劍橋大學Frederick Sanger團隊所使用的聚合鏈終止法(chain- termination method),後來亦通稱桑格定序法。
Sanger 發明的定序原理,其精髓就在於利用DNA合成時聚合酶反應的特性,並依此設計反應試劑。依 4 種鹼基分類,除了加入一般DNA合成所需的去氧核苷酸(dNTPs)外,也加入一定比例以放射性同位素標記的雙去氧核苷酸(ddNTPs)。由於ddNTPs比正常的 dNTPs 在三號碳上再少了一個OH基,若 DNA 合成時接上少了OH基的 ddNTPs,就會無法繼續進行反應而終止。由於接上ddNTPs是隨機的,也就可以得到各種終止於不同長度的DNA 片段,最後再透過膠體電泳分析和顯影,即可依據電泳位置圖讀出DNA 序列。
同年,Sanger團隊也靠此原理,破解了第一本迷你本天書,也就是「噬菌體ΦX174」的基因序列,總長5,386bps。這項技術等於為人類讀取和理解基因序列奠定了厚實基礎,Sanger本人也繼1958年後再度獲得1980年諾貝爾化學獎殊榮[1]。爾後,在Sanger定序法的基礎上,80 年代出現以螢光標記代替放射性同位素和自動定序儀器,90 年代更發展出毛細管電泳技術,使得單位時間內的定序能力大幅提升。
此外,聚合酵素鏈鎖反應(PCR)的發明,更是另一個加速近代基因工程發展的幕後功臣。雖然這項技術也只不過於1983年由Kary B. Mullis提出,但已成為分析DNA不可或缺的技術。有了這個方法,我們能在幾個小時內,將特定DNA片段在試管內複製上百萬次,不論對於醫療檢測和現場刑事鑑定上,都提供了一些新的可能,甚至是已絕跡的物種或古老人類基因(ancient human DNA)研究也有了突破。當然,Mullis 也因此成就獲得1993年諾貝爾化學獎,以表彰這項掀起革命性發展的發明。
●演繹經典 百家爭鳴
顯然科學家在擁有足以解讀序列技術的加持下,其野心和算盤勢必動到人類頭上,期望能正確描述並解答各章節指令的來龍去脈。人類基因體計畫(Human Genome Project, HGP)始於九○年代初期,起初由科學家Renato Dulbecco於 1985年提出,1990年美國官方拍板定案贊助為期15年30億美金計畫,並透過國際實驗室合作,包括美、英、日、法、德、西班牙、中國、澳洲等跨國合作。不過,與此同時,美國私人企業Celera也不甘示弱,集資3億美金投入研究,採取另類的策略,最後甚至打敗政府速度。
從官方與民間組織的競爭到後來攜手合作,都足以看出人類基因序列的重要性和眾所期待,但如果有廠商打的是基因專利的主意,那可就算錯了。2000年美國總統柯林頓宣布人類基因體資訊將完全免費公開於美國國家生物資訊中心(NCBI)資料庫,確立天然基因序列歸屬於自然產物,不可申請專利的原則(但cDNA和經人為編譯者可以)。此舉不但建立劃時代的里程碑,也為2003年正式完成的人類基因體計畫,揭開下一個序幕。
至此,人類基因體計畫的完成,讓我們從過去一無所知,到能讀出編排有序的「有字天書」。但科學家可不因此滿足,同年9月即展開「ENCODE計劃」 (ENCODE=The Encyclopedia of DNA Elements),目標是註解人類基因體的所有功能,因為除了握有字元,我們更希望的是能讀懂這部著作的經典之處。當然,其他物種的解序工作也馬不停蹄的進行,包括酵母菌、線蟲、果蠅、小鼠、水稻乃至黑猩猩等多種模式生物亦陸續完成。
●下一步,人定勝天?
自1977年第一種DNA定序方法出現至今已40餘年,隨後PCR的發明、人類基因定序完成,甚時至2015 年,美國公司Veritas Genetics 宣布能以 1000 美元成本定序個人基因等歷程來看,基因工程發展速度已不可同日而語,價格上更是日趨便宜[2]。但下一步呢?面對生命現象如此複雜,絕非一對一簡單線性的交互作用下,以基因為首的課題,顯然並非純粹客觀的技術問題。重要的是,這樣的技術躍進,是否能為社會帶來正向影響和改變?不論是面對人口成長的糧食問題或癌症研究等難題,相信這一本本天書都還有一些尚待人類參透的地方。
---
[註1] Frederick Sanger,英國生物化學家,是第一位兩次得到諾貝爾化學獎得主。1958年因確立胰島素的分子結構,獲頒第一個諾貝爾化學獎。
[註2] Genomics and the role of big data in personalizing the healthcare experience
延伸書籍 | 《基因組:人種自傳23章》
延伸圖表 | Human Genome Project Timeline
--本文整理自:107/4/14由于宏燦老師在臺大思亮館國際會議廳所主講之「讀一本生命的無字天書:解碼基因體DNA」演講內容。