AI在生殖醫學的應用
撰文/陳儁翰|醫學顧問/蔡鎧任(台南奇美醫院內科住院醫師)
年齡之外的影響因子
過去人工受孕有將近75%的機率無法活產,而臨床上的治療與對患者未來健康狀況的評估(即預後)則主要以患者年齡為依據(也就是根據年齡將病人分成不同類別,給予相應的照顧與治療),低估(或完全忽視)其他指標可能造成的影響,於是激起研究人員引入機器學習的動機。
首先我們來談談Banerjee等人所收集的數據。Cycle 1(C1)是指病人第一次進行人工受孕的整個週期,Cycle 2(C2)則是病人第二次進行人工受孕的整個週期。研究人員收集了2003至2006年間,1,676筆C1資料與732筆C2資料作為訓練資料集;另收集2007至2008年間,634筆C1資料與230筆C2資料,用以驗證系統的預測能力。由於胚胎的各方面數據是預測活產率的關鍵,所以必須經過第一次人工受孕,方能有較準確的預測。研究人員希望能以C1階段的數據來預測後期,甚至C2的活產機率。
研究人員選用Generalized Boosted Models (GBM®)這套自由軟體進行資料分析,篩選出52個與活產率相關的胚胎特徵,依重要性排列前幾名分別是:囊胚發育率(26%)、施用促性腺激素的總量(10%)、八細胞胚胎數(9%)、胚胎冷凍保存(7%)、女性患者年齡(6%)、子宮內膜厚度(6%)以及胚胎總數(6%)。套用在驗證資料集上(2007-2008的資料),這套新模型IVFBT的預測能力明顯優於傳統以年齡為主的預測模型。
更好的預測模型
接著,研究人員想知道根據C1特徵訓練出來的模型,是否也能用來預測C2的活產率?然而,數據統計顯示C2的活產率普遍較C1的活產率低,所以若將模型直接套用於C2可能高估活產率。於是,研究人員利用C1與C2相對應的資料建立線性模型,將預測結果以這個線性模型作修正,得到專屬於C2的活產率預測模型IVFBT C2。
透過下圖ROC曲線(Receiver Operating Characteristic Curve),我們可以看到IVFBT(左圖綠線)對C1活產率的預測,以及IVFBT C2(右圖紅線)對C2活產率的預測,都比傳統模型(藍線)更具鑑別度。研究人員相信,這套頗具彈性的建模方法,未來也能拓展應用於其他案例。
延伸閱讀:AI的表現好嗎?十種常見的評估指標
參考資料
P. Banerjee et al., “Deep phenotyping to predict live birth outcomes in in vitro fertilization“, Proceedings of the National Academy of Sciences, vol. 107, no. 31, pp. 13570-13575, 2010.