【探索十】醫學中的數學偵探
第六講‧特稿
■ 數學不但可以解釋物理和化學中的許多現象,在生物醫學研究中扮也扮演重要的角色,而遺傳學或許是第一個把數學帶入生醫研究的學問。
撰文│李銘杰
第十期探索講座「聽數學與生命對話」,共有八場的專題演講,「醫學中的數學偵探」是系列演講的第六場。主持人,同時是此系列講座的顧問之一楊偉勛教授談到,數學不但可以解釋物理和化學中的許多現象,在生物醫學研究中扮也扮演重要的角色,而遺傳學或許是第一個把數學帶入生醫研究的學問。
楊教授指出,臺灣大學的學生素質並不輸給劍橋大學,但臺大從未有本土諾貝爾獎得主,可能的原因與今天的演講內容有關。
演講者陳秀熙教授原是一位牙醫師,後來到劍橋大學攻讀生物統計學博士,從此和數學結下緣分。除了原先預定的主題之外,陳教授特別安排了劍橋導覽,帶台下觀眾欣賞劍橋之美以及過去輝煌的歷史。
若有機會一遊劍橋大學,有兩個地區一定要去參觀,其中一個是卡文迪西實驗室(Cavendish Laboratory),另一個則是分子生物學實驗室(laboratory of Molecular Biology, LMB)。這兩個實驗室擁有無數的諾貝爾獎得主。陳教授認為,兩個實驗室之所以能產出這麼多的諾貝爾獎得主,可以以相關事件(correlated events)來解釋。諾貝爾得主所帶領的學生,得諾貝爾的機率確實也會比較高,這就是條件機率的一種。條件機率則和今日的演講主題之一貝氏數學密切相關。
辛普森矛盾
在探討數學在醫學中的應用之前,陳教授先帶大家認識數學中一個有趣的現象,稱之為辛普森矛盾(Simpson’s paradox)。舉例來說,棒球球員Max在兩分打點及三分打點的打擊率都比John來得好,但整體平均的打擊率卻比John來得差,球隊老闆若以平均打擊率作為薪資計算的標準,John反而會獲得更多的薪資,這種情況對Max而言似乎並不公平。陳教授指出,問題是出在三分打點相較於兩分打點而言難度更高,自然打擊率也會較低,而Max有較多的三分打點,一旦以平均的方式計算,Max的整體平均打擊率就被拉低了,反而無法突顯Max的功勞。
辛普森矛盾也經常出現在生物醫學研究中。舉例來說,手術形式分成A和B兩種,比較哪一種手術發生感染的危險性較高。在流行病學中,常用來比較發生率是否不同的運作工具為相對危險性(relative risk, RR)。分別算出A手術和B手術的感染發生率後,將兩個發生率相除,即可得到相對危險性。若是以B手術為參考點,A手術感染發生率除以B手術感染發生率,若是結果大於1,表示A手術有較高的危險性會發生感染。在不考慮其他因素的情況下,A手術看似有較高的感染發生率,但若是考慮病患的體重後會發現,接受A手術的病患肥胖者較多。肥胖是手術發生感染的一個重要因子,若是將病患以肥胖與否先進行分組,再各自比較A手術或是B手術的感染危險性,則會發現A手術和B手術的危險性其是一樣的。
陳教授指出,若是在做重大決策之前沒有注意到辛普森矛盾,很有可能做出錯誤的決策,並忽略了真正重要的影響因子。
以數學模式偵測辛普森矛盾
在數學計算中,數學家常以2×2列聯表以及共變數(covariance)來解釋辛普森矛盾。藉由2×2列聯表邊緣的數字及共變數的大小與正負之間的關係,可得到三種結果,分別為正相關,負相關以及獨立事件。陳教授特別提到,此類的運算過程必須設下參考組,當參考標準為同一個時,兩個不同的事件才能互相比較。
但如何以數學模式偵測某個事件中有辛普森矛盾?舉例來說,先將病患分成治療組(X=1)或是未接受治療組(X=0),成功組(Y=1)和未成功組(Y=0),以及男性(Z=1)及女性(Z=0)。此時若是不治療組成功率與性別接受治療比率之相關性越大,代表性別很有可能影響治療成功與否,產生辛普森矛盾。其數學公式可以呈現如下:
如何解決辛普森矛盾
因果關係中,X會導致Y,但Z會影響X和Y的因果關係,此時要如何消除Z所帶來的影響?有兩種數學模式常用來解決此類問題,其一是隨機分派試驗(randomized clinical trial),另一種則是以迴歸模式(regression model)來校正辛普森矛盾。
辛普森矛盾在流行病學中又稱為干擾因子,線性(linear)或是邏輯斯迴歸(logistic regression)常用來排除干擾因子所帶來的假性相關。舉例來說,研究發炎指標C-Reactive protein是否能用來偵測冠狀動脈心臟病(coronary heart disease)的發生,一開始只將性別、年齡等干擾因子加入邏輯斯迴歸時,還可以看到發炎指標C-Reactive protein偵測冠狀動脈心臟病的效果極佳,但隨著迴歸模式中加入的干擾因子越多,C-Reactive protein的偵測力就越來越差了。若是沒有校正這些干擾因子所產生的假性相關,就會誤以為C-Reactive protein偵測冠狀動脈心臟病的效果很好。
辛普森矛盾與諾貝爾獎之迷思
90年代以後,劍橋大學獲得諾貝爾獎的比例逐漸減少。劍橋大學研究後發現,隨著研究單位數目越多時,得到諾貝爾獎的比例就越少,這也是辛普森矛盾之適例。若將研究單位分成理論型研究所以及應用型研究所,並分析研究所單位數目和得到諾貝爾獎的比例時,仍舊是呈現正相關。
以上的現象又可稱為生態謬誤(ecological fallacy),也就是以群體分析的資料結果來對個別情況進行推論時所產生的錯誤。相反地,若是以個別資料分析的結果去推論群體情況所產生的錯誤,就稱為原子謬誤(atomistic fallacy)。而以上兩種謬誤皆會使我們做出錯誤的決策。
辛普森矛盾的問題
辛普森矛盾的假設本身也有缺陷。辛普森矛盾假設所有事件都是對稱的,事實上並非如此。在同一層分析中,也有可能同時存在正相關和負相關兩種事件,而這種同時存在正相關和負相關的情況,又稱作修飾作用(effect modification)。故考慮辛普森矛盾時,應注意有修飾作用存在的可能。
此外,先前提到辛普森矛盾會產生兩種情況,其一是生態謬誤,另一種則是原子謬誤,而身為研究者的我們,如何知道何者才是正確的?簡而言之,究竟要以分層以後的結果來做決策,還是以未分層之前的結果來做決策?陳教授指出,這必須根據研究的內容的因果關係來決定。
舉例來說,有三個研究變項,分別為性別、治療以及治療後是否會好轉三,計算之後發現可能的因果關係組合共有六種,究竟哪一種組合才是正確的?陳教授指出貝氏網路分析可用來尋找最有可能的因果關係組合。
此外,陳教授團隊發展出一種特殊的辛普森矛盾,稱之為局部的辛普森矛盾(Partial Simpson’s paradox)。由於真實的世界中,結果的發生常常不是全有全無,一件事情發生,並不一定會導致某種結果。陳教授以國內的臨床資料配合數學模式證明了這種現象確實存在。
辛普森矛盾和時間因子
辛普森矛盾也和時間有關,如何校正時間所帶來的干擾,需要藉運Cox model。陳教授提到,前衛生署長涂醒哲教授的專長是雞尾酒療法,某日涂教授提到,臨床上的觀察發現,使用雞尾酒療法僅對20%的愛滋病患有效,但國家研究報告卻發現,雞尾酒療法能降低80%以上的死亡率,與臨床觀察差距過大。陳教授指出,這是典型的療效評估選擇偏差,類似辛普森矛盾現象,但並非完全相同。我國從1996年開始使用雞尾酒療法,有些病患等不到雞尾酒療法出現就已經病逝,故能夠接受雞尾酒療法的病患至少活到1996年。若是進行雞尾酒療效評估時,沒有將先前的時間因素考慮進去,就會發生高估療效的情況。此時以時間相依之Cox model進行分析,就可以解決這樣的問題。
貝氏哲學
一件事情的發生,會影響後面事情發生的機率,這是條件機率的概念,也是貝氏數學的精神所在。貝氏哲學也不斷在生活中印證,回到陳教授先前提到的諾貝爾獎例子,當一個地方有多位諾貝爾獎得主時,之後進來就讀的學生,得到諾貝爾獎的機率也會較高,這是因為指導學生的老師,許多都是諾貝爾獎得主,研究視野和深度也有所不同。
最後陳教授仍再三提醒,統計和數學可以解決辛普森矛盾,但無法釐清因果關係,仍需要配合其他的專業知識和研究資料才能做決策。而療效評估的部份要考慮選擇偏差的問題,可用時間相依之數學模式解決,避免決策錯誤。臨床決策的推理可能會因為事前的情境不同而有不同的結論,貝氏數學可以用來解決此方面的問題。
問題與討論時,陳教授和楊教授特別提到,他們不認為自己這一代能有機會獲得諾貝爾獎,但相信下一代能夠達成他們的期望,藉此勉勵在座的年輕學子。
--
本文整理自:102/11/23下午由陳秀熙教授在臺大應力所國際演講廳所主講之「醫學中的數學偵探」的演講內容
延伸閱讀:臺大科學教育發展中心探索基礎科學講座2013年11月23日第六講〈醫學中的數學偵探〉全程影音
責任編輯:Vita Chen