【探索10 】解密孟德爾:機率與基因定位

分享至

第五講‧特稿

■ 小小豌豆開啟了遺傳學研究大門。

P26 新配圖
圖片來源|Flickr@ DaveFayram

撰文張思遠


種豆只得豆?

栽種植物可以陶冶性情,可是我們又知不知道,豌豆莢除了綠色以外還有黃色,有些飽滿有些皺縮,種皮有的圓潤有的長皺紋,植株有些長得比較矮,頂生或者腋生,花除了白色還有紫色,觀察到豌豆具有這七種遺傳性狀的,就是遺傳學之父孟德爾,作為一名神職人員,空餘時間以種豌豆做實驗為樂。

高個子豌豆的子代可能出現矮個子,而矮個子豌豆的子代也有高個子,孟德爾推斷當中應該是有某些因子在支配著遺傳性狀的表現,於是展開長達八年,栽種豌豆數目達到兩萬八千株的雜交實驗。假設每顆豆子體內各帶有一成對因子,因子有一對G的,有一對g的,也有G跟g混搭,現在把同為G的高個子跟同為g的矮個子進行雜交,得到G跟g並存的非純種,子代全為高個子,矮個子暫時退隱,所以高個子是顯性性狀,這就是顯性原則(Law of dominance)。

這些非純種的子代再進行雜交,排列組合應該為GG、Gg、Gg跟gg,所以第一子代中銷聲匿跡的矮個子在第二子代重現,根據統計結果,高個子跟矮個子的數量約為3:1,印證了孟德爾的假說,成對因子在雜交過程中會被打散,然後再重新進行組合,這就是分離定律(Law of segregation),也是孟德爾第一定律。

如果覺得單一性狀太單調,接下來是黃色圓潤跟綠色皺摺豌豆的雜交實驗,結果發現黃色圓潤、黃色皺摺、綠色圓潤以及綠色皺摺的比例約為9:3:3:1,光看數字讓人眼花瞭亂,如果從黃跟綠、圓跟皺兩組顯隱性狀分別觀察,就會發現黃色跟綠色比例為3:1,另外圓潤與皺摺的比例還是3:1,說明成對因子的自由組合其實是各自為政的過程,不同遺傳性狀不存在任何交流,這就是自由組合定律(Law of independent assortment),也是孟德爾第二定律。

孟德爾奠定了遺傳學的理論基礎外,同時也率先把數學工具引進到研究當中,原來遺傳學問題可以通過數理統計得到解答,此後相關的研究有如雨後春筍般萌發,涵蓋到豌豆以外其他生物,包括人類。

 

連鎖分析與相關性研究

人體有23對染色體(Chromosome),形態上酷似不規則版的英文字母X,由中節(Ceretromere)分成兩段,較短的一段稱為p臂(p arm),較長的一段則稱為q臂(q arm),成分由ATCG即腺嘌呤(Adenine)、胸腺嘧啶(Thymine)、胞嘧啶(Cytosine)及鳥嘌呤(Guanine)所構成。

遺傳疾病根據不同致病成因可以分為單一基因突變、染色體變異以及多基因共同影響,當中由於單基因突變所引發的遺傳疾病又稱為孟德爾型病症。

不管調查何種類型的犯罪,確定嫌犯都會是前提條件,同樣地,要對症下藥,首先要找出遺傳疾病的致病基因。世界之大,包羅萬象,我們需要地圖,需要導航定位,從前用指南針,後來更有了全球衛星定位系統,才不致於迷失方向,染色體上的基因位點(Locus)多如牛毛,所以要找到致病基因的位置同樣需要地圖,需要定位。定位致病基因的統計方法,分別有連鎖分析(Linkage analysis)和相關性研究(Association study)兩種。

基因標記(Genetic marker)用作定位致病基因,當中特別是單一核苷酸多型性(Single Nucleotide Polymorphism, SNP),根據美國國立生物技術訊息中心的數據,人類有1億多個SNP,出現頻率約為0.1%,在人體內分佈廣泛,是優良的地標性參考物。有沒有想過醫療也可以客製化?SNP是造成個體間體質差異的主因,所以把SNP引入到基因診斷,能夠做到診斷醫療的量身訂做,減少病人對藥物產生不良反應的機會。另外,科學家對SNP的序列已經有相當了解,利用基因晶片(Gene chip)可以快速精確檢定基因多型性,已經進入商業化量產,成本低廉。

基因位點之間距離有長有短,越近的羈絆深厚,連鎖存在,越遠的容易見異思遷,連鎖不存在,重組率也越高,透過觀察基因標記的基因型由親代遺傳到子代的模式,用統計方法計算致病基因與每個基因標記的重組率(Recombination fraction),重組率越高表示致病基因與基因標記距離越遠,反之亦然,大致定出致病基因的相對位置。

現在假設有11個小孩,基因標記A、B和C,其中有1個小孩AB發生重組,則AB的重組率為1/11,3個小孩的AC發生重組,AC的重組率是3/11,孟德爾第二定律所依據的事實是基因不連鎖,也就是基因可以完全打散後再重組,兩個基因標記不連鎖,則11個小孩都發生重組的機率為 ,如果11個小孩中有1個標誌基因AB連鎖,也就是違反孟德爾第二定律,則10個沒有發生重組的機率為01 ,有3個基因重組,那麼8個沒有重組的機率為 02

發生重組機率與沒有發生重組機率的比值就是勝算比(Odds),取對數後得到LOD scores,上例中發生AB重組的可能性1/11,代入計算LOD scores為1.85,發生AC重組的可能性為3/11,代入計算LOD scores得到0.51,LOD scores較大代表距離比較近,反之亦然,由此可知標誌基因A離B較近,離C較遠。

電影《那些年,我們一起追的女孩》的男主角柯景騰曾經說過:「我敢跟妳賭,十年後,我連log是什麼都不知道,照樣活得很好。」很遺憾的是,不用等十年,不懂得log,現在就沒辦法進行基因定位。連鎖分析之所以選擇log作為計算工具,是基於log能夠相加的性質,剛才11個小孩的家庭中有1個發生基因重組的LOD scores為1.85,假設另外有相同狀況的家庭,則LOD scores將會是1.85加上1.85也就是3.70,LOD scores能夠不斷累加,在標誌基因定位致病基因的情形,LOD scores必須大於3才具有統計上顯著性。

研究人員利用基因的相對位置描繪出基因圖譜(Genetic map),找到遺傳疾病的致病基因的大概位置。家族支系往往錯綜複雜,亨丁頓舞蹈症(Huntington’s disease)是單一基因突變的顯性遺傳疾病,患者腦細胞神經原持續退化,導致活動失控,智能減退,如果要估計一個m人家族譜系帶有這種基因型的機率,可以透過個人所帶基因的外顯率乘上個人所帶基因的基因型當中來自父母基因型的機率或是來自族群的頻率,所有家族成員都如是操作,最後把各人的機率加總而求得,過程繁雜讓人想睡覺,能夠有今天的研究規模,計算機可謂功不可沒。

然而,資料蒐集並不全然都要大家族,有病同胞手足(SIB)資料分析法就運用孟德爾第二定律,比較帶病的兄弟姐妹之間,對偶基因的相同究是源自父母(IBS),還是純粹巧合(IBD),如果帶有的基因只有父或母一人所有,可以認為來自父母,但父母雙方都有的話,可能只是巧合,如果沒有父母的資料,但該基因在族群裡相當罕見,就比較有可能出自父母,反之亦然。但現實與理想不免存在落差,以上是預設受試者為親生手足同胞,但為了獲得實驗報酬而冒充的比比皆是,金錢不要緊,影響實驗結果事關重大,還好後來發現只要掌握到50個基因標記就能夠確定親屬關係,基因原來也會說話的。

連鎖分析用於定位單一基因遺傳疾病的致病基因成效顯著,但多基因遺傳疾病是多個致病基因分工合作的結果,致病基因之間發病程度高低有別,有些甚至不發病,還有環境因素摻雜其中,變數太多,用連鎖分析只能抓到個別小混混,意義不大,要把整個犯罪集團一網打盡,需要相關性研究。

等位基因(Allele)作用上類似於豌豆對偶性狀的遺傳因子,染色體就像把字母X中分那樣的兩條成對存在,位於同源染色體兩邊相同位置上負責控制某一遺傳性狀的不同表現形態,例如黑髮或者金髮的表現,等位基因頻率(Allele frequency)是指一個群體在特定的基因位點上某種等位基因出現次數占整體的比例,相關性研究在沒有親屬關係的族群裡,透過比較病患與對照組,觀察可能的致病基因出現次數,與期望出現次數之間作比較,用卡方檢定統計該基因與發病是否顯著相關,我們只關心病患組等位基因頻率與對照組的差異,個體基因型在所不問。

家庭危險因子比率(L)是家人得病機率與一般人得病機率的比值,L大於2就代表有遺傳因素存在,以阿茲海默症(Alzheimer’s disease)為例,病人兄弟姐妹得病機率為30%,而一般人得病機率為10%,則L等於3,亨丁頓舞蹈症的L等於5000,具有高度遺傳性,家人比一般人得病機率高出5000倍,幾乎無法迴避,不過上得山多終遇虎,遺傳性越高就代表曝光率越高,致病基因容易被定位,對疾病治療具有莫大助益。

 

未來定位致病基因研究的挑戰

複雜性疾病(Complex disease)也就是多基因遺傳疾病,就像沒有頭目的犯罪集團,需要釐清這些致病基因間的關係,以期在疾病治療診斷上作進一步突破,另外,遺傳疾病並不全然由基因所主宰,環境也是不可忽略的因素,像先天性肥胖,暴飲暴食加上缺乏運動會使症狀加劇,當中基因與環境的角色輕重該如何定位將會是一大挑戰。受惠於科技進步,成本不斷降低,但一般實驗室仍然難以負擔,同時伴隨資料量日益增加,造成儲存與分析上的困難,未來出路基本上是往商業化推廣投產。

探索科學不是特定人的專利,也不需要亮麗浮誇的招式,對後世影響深遠的遺傳學研究是由一個業餘的科學愛好者所開創,所需要的,只是單純對事物的觀察入微以及對科學的不捨追求,這些特質都是我們與生俱來的,不要自我設限,科學的探索本來就是永不止息,雖然不知道前方會遇到些甚麼,但仍然勇往直前,這就是科學精神,愛因斯坦曾經說過:「我喜歡旅行,但不喜歡到達目的地。」

--

 本文整理自:102/11/16下午由范盛娟研究員在臺大應力所國際演講廳所主講之「解密孟德爾:機率與基因定位」的演講內容
 延伸閱讀:臺大科學教育發展中心探索基礎科學講座2013年11月16日第五講〈解密孟德爾:機率與基因定位〉全程影音

責任編輯:Vita Chen

(Visited 822 times, 1 visits today)

分享至
views

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *