收拾人類基因的善後
收拾人類基因的善後
知識通訊評論第87期
多次大張旗鼓宣稱已大功告成的人類基因定序計畫,事實上其中還有諸多的缺口和錯誤,為了在臨床治療上能夠派上用場,還得靠一些默默工作的研究人員來更正最終的版本。
在美國國家衛生研究院的五樓無窗辦公室裡,邱琪(Deanna Church)幾乎是心無旁鶩地專注於眼前的工作,她電腦上顯示人類基因序列還有八百八十八項問題未解決,雖然數字偶有變動,但已很清楚地告訴她和國家生物科技資訊中心的團隊,人類基因計畫自近二十年前開始,離完成還有很長一段距離。
就是這項計畫,讓國際科學家已耗資近三十億美元。二○○○年,科學家在白宮一項典禮上宣布,他們已完成人類基因序列草稿,隔年發表此一演化詩篇的草圖又慶祝一次;二○○三年序列正式宣告完成時,科學家又開香檳再次慶功,當時媒體已顯然有些厭倦,不過在科學家保證已是最終成品之後,仍陸續公布修正改版,直到二○○六年才正式發表修飾後的完整基因序列。
然而時隔三年,邱琪卻仍在電腦前操作,靜靜地解決基因序列的種種問題,這些問題由全球各地的研究人員通報,多數是發現有所缺漏,也有些認為序列出現錯誤,還有些涉及複雜的DNA重組問題,得花費好幾年才能處理完畢。
德州人類基因序列中心主任吉布斯(Richard Gibbs)表示,「這實在令人很洩氣,這個序列品質極高,但極少數的不確定因素卻仍衍生出諸多問題」。
邱琪的團隊希望建立一套正確的參考序列,但顯然不易完成,例如這套序列其實不代表任何人的基因,而是混合眾多男女的DNA而成,以確保基因來源人士的私隱,並讓序列能代表全人類。
但要呈現這種共有資產並不容易,人與人之間的基因差異遠大於先前預期,三十億組鹼基對只要有任何一點改變,就可能影響數百萬個鹼基對。
故最後若能完成一套參考序列,將與初始版本大不相同,這也正邱琪及其團隊投入貢獻之處,希望能弭平其間差異,盡量捕捉人類的共通及獨特之處,有些人認為此舉浪費金錢,因為今日製作序列成本遠低於十年前,不過許多人主張,這套序列非常寶貴,可作為未來人類基因組研究的基石。
但解決序列問題不會為邱琪贏得多少美名,不會因此面見總統或出現在任何知名期刊裡,每當解決一個問題,還有下一個等著她,她認為這項工作雖不吸引人,但很重要。
責任聯盟
二○○三年四月,基因序列跨越了國際計畫完成的技術標準,涵蓋染色體中基因的百分之九十五,以及一萬個核酸中少於一個錯誤,但大約仍有三百五十個缺口,且多數結構變異未能包括其中。
邱琪與數十位研究人員二○○四年在英國開會,討論基因與結構變異,其中有項抱怨反覆出現:新資料無法輕易修正或更新基因序列。在一九九○年代的全盛時期,研究人員能聯絡主要的研究中心,通報任何基因序列疏漏,但到了二○○四年,多數研究中心已不再積極處理此事,科學界也大多無意再重拾舊工作,但卻造成問題,因為還是有人得負責,才能在找到錯誤時改善基因序列。
邱琪於是和歐洲生物資訊研究院柏尼(Ewan Birney)合作申請經費,經過逾兩年的會議與說明,獲得了兩筆最高各一百萬美元的營運經費,其他單位則協助處理資訊流通,這項合作計畫名為「基因參考聯盟」,目前已是改善基因序列最主要的機構。
為改善現況,研究團隊主要有三項目標:訂正錯誤、填補缺口、在高變異性區塊提供其他參考序列。
在當初人類基因計畫結束之時,研究人員便已列出前兩項目標,但之後卻沒有下文,有些區塊格外難以處理,例如無法在細菌身上製造多個相同序列,這是定序必要過程;不過隨著新方法出現,已變得容易許多,二○○九年初,美國劍橋大學基因序列與分析計畫共同主持人諾斯包姆(Chad Nusbaum)及其團隊使用下世代定序科技,不需使用細菌即可完成這個步驟,研究成果也交給「基因參考聯盟」,納入參考序列之中。
第三項目標則是最近才出現,原本研究人員預期人和人之間的基因差異只是單一DNA符碼,現在透過不同方式,才更瞭解結構變異的程度,雖然有些變異與遺傳性疾病相關,但因為不易對照參考序列,故更難以追蹤,研究團隊現在希望以其他參考序列,來呈現基因多元性。
紐結和轉向
例如在組織相容複合基因中,這些在六號染色體中與免疫力有關的基因,是變異性最大的,原本的基因參考序列混合不同來源、不同區塊的DNA,讓最終序列不會與特定人物吻合,後來為了建立來源更明確的參考序列,倫敦大學學院癌症研究中心貝克(Stephan Beck)領導的團隊比對歐洲常見的DNA區塊,結果發現超過三萬七千項DNA差異及七千項結構變異,這些研究成果同樣納入「基因參考聯盟」的成果之中。
其他兩個區塊亦有替代參考序列,如第四號染色體與類固醇及其他藥物代謝有關,研究團隊發現原本的參考序列缺口原來是統計方法所致,故現在提供另一個參考序列。
另一個區塊則是第十七號染色體,也反映出原本參考序列的限制,科學家於二○○五年提出另一套序列,完全倒轉第一套序列的模式,不過華盛頓大學基因學家埃奇勒(Evan Eichler)與另外兩個團隊在二○○六年指出,這個區塊可能與智能發展遲緩有關。
為瞭解其中因素,埃奇勒便需要基因序列,他與其他研究人員合作,重新排列這個區塊的序列,等到他們於二○○八年發表研究成果時,「基因參考聯盟」運作已上軌道,正努力修補基因序列缺口,於是埃奇勒便將研究成果交給他們,納入新版參考序列之中。
埃奇勒指出,這些基因區塊如此複雜,故當然需要多項參考序列,才能發現涉及許多疾病的突變情況,他估計大約百分之五的基因需要多重參考序列,才能呈現人類多元性,這些區域大約包含上千條基因,影響範圍包括免疫反應、藥物解毒作用及生殖能力等。
一項共同工作
「基因參考聯盟團」於二○○九年三月首次公布成果,除更新了三個區域的參考序列之外,修正了逾一百五十件問題及填補二十五項缺口,但缺口仍有三百處以上;九月時,研究團隊其中二十位成員集會,討論下一步該如何進行,顧問團則建議,基因組應包括最常見的DNA序列,不過並未定義何謂「常見」,究竟應該是出現頻率最高項目,抑或是占多少人口比例?而分母究竟是全球超過六十億的人口,抑或是特定地區或族群人口?目前正進行的「一千基因組計畫」中,試圖將全球四大洲約兩千樣本的基因序列分類,研究結果應可做為參考。
有些「基因參考聯盟」的成員不支持大幅更動參考序列,主張只要還能發揮效果,就沒有必要大規模修正序列內容。
外界則質疑這整個研究計畫的必要性,不明白為何得修正十年前的排序結果,認為不會帶來實質影響,邱琪則認為批評者只看到基因體學的架構,卻忽略重要的小細節,且實際上對研究人員而言,每個區塊都很重要,故她手中永遠不乏需要解決的問題。隨著基因體學逐漸朝向個人化醫療發展,若基因序列與特定疾病相關,這個序列只要有一絲不完整或錯誤,研究便會失敗。
故「基因參考聯盟」會繼續埋頭更正的工作,除非未來排序科技不需參考序列,人類就得持續改善參考基因組裡的變異。這個研究團隊也同時負責改善老鼠的基因序列,二○一○年也將開始負責斑馬魚的序列,雖然這項工作不會占據媒體頭條,但學界多數都肯定其重要性。紐約冷泉港實驗室的基因學家希貝(Jonathan Sebat)認為,這件差事很費時,但必須要有人來收拾善後。





前一篇文章
下一篇文章
