AI挑戰皮膚癌診斷

AI挑戰皮膚癌診斷

編譯/許晉華 

CNN的優異表現

全球每年約有23.2萬黑色素細胞瘤新增病例,並造成5.6萬名患者死亡。然而,事實上,黑色素細胞瘤是可以被治癒的,惟多數病例遲至中晚期才被確診,錯過治療時機。德國海德堡大學皮膚科醫師兼教授Holger Haenssle解釋道:過去20年來,他與研究團隊致力於發展非侵入性的皮膚檢測技術,希望能輔助醫生診斷並降低遺漏黑色素瘤的可能。而當他注意到深度學習,尤其是CNN在其他領域的亮眼成績時,便立刻帶領團隊投入相關研究。

CNN的運作如同一個小孩的大腦,利用10萬張皮表透光顯微鏡影像,進行訓練與學習,改善模型的整體表現。訓練完成後,另由海德堡資料庫中蒐集兩組測試資料集:一組包含300張影像,主要用以測試CNN的性能;另選用100張難以分類的病變影像,則用以比較AI與專業醫療人員人為判斷的差異。所邀集的皮膚科醫師來自全球17國家,共計58名,逾半數以上有五年以上的專業皮膚科執業經驗。

研究主要分為兩個階段。第一階段,皮膚科醫生被要求直接基於影像分辨疾病良、惡性,並提出對應的治療方案,包含手術切除、定期追蹤或無須治療。經一個月後進行二次判讀,此時將提供包含病患年齡、性別及病灶位置等病歷資訊,以及100張特寫影像,讓醫生再次診斷和下決策。

在第一階段,皮膚科醫師僅憑影像與專業經驗的情況下,惡性黑色素細胞瘤的確診率平均達到86.6%,良性痣的分辨率達71.3%,然AI的黑色素細胞瘤確診率卻高達95%。在第二階段中,皮膚科醫師的表現分別提升至88.9%及75.7%,但仍不及AI亮眼。

Haenssle指出,AI所遺漏的惡性黑色素瘤較少,代表其敏感度 ( sensitivity ) 高於皮膚科醫生;誤診率也較低,顯示其特異度 ( specificity ) 也略勝一籌,可以避免不必要的手術。而即使皮膚科醫師在二階段時表現有所提升,但AI在缺乏病歷等詳細資訊的情況下,仍有較高準確率。綜合兩階段的整體表現,無論專業執業醫師的經驗豐富與否,人為判讀始終不及AI。

然而該研究的主要目的,並非完全取代皮膚科醫生,而是讓AI成為輔助診斷的一環,協助醫師進行臨床檢驗,幫助他們決定是否採集檢體。此外,由於臨床上,多數醫師已改採數位皮膚鏡作檢測,若能與數位影像記錄結合,應用於後續追蹤診斷,AI可以更有效且迅速的判定病灶是否為惡性腫瘤。

門檻與限制

然而這份研究也存在一些限制,其中包含作為比較參照的皮膚科醫師們,明白這僅是實驗設定,並非生死相關的診斷及決策;另外,測試資料集中的皮膚病變影像並不完整,且缺乏高加索人種外的資料。最後,醫生必須與AI建立起互信關係,否則可能不會完全遵照透過CNN所得出的結論與建議。

澳洲墨爾本蒙納士大學的Victoria Mar博士及布里斯本昆士蘭大學的H. Peter Soyer在相關的社論中指出:目前黑色素細胞瘤的確診率,仍取決於醫生的臨床經驗及培訓。Haenssle等人的研究已證實CNN的性能已超越多名皮膚科醫師與專家,代表AI具有標準化的診斷能力。也就是說,無論病患的居住地和看診醫生為何,皆能得到可靠的評估診斷。

同時,他們也點出幾個AI在實際投入前需要突破的難題,包含生長在如手指、腳趾及頭皮等,皮膚鏡難以捕捉的病灶;此外,如何訓練AI辨別非典型黑色素細胞瘤,甚至是病患本身尚未察覺的皮膚病變,都是待解決的課題。總而言之,AI自動診斷系統,距離完全取代臨床皮膚檢測仍有一段路要走。

 

參考資料

  1. European Society for Medical Oncology. “Man against machine: AI is better than dermatologists at diagnosing skin cancer.” ScienceDaily, 28 May 2018.
  2. V J Mar, H P Soyer. “Artificial intelligence for melanoma diagnosis: How can we deliver on the promise?” Annals of Oncology, 2018.

(本文由教育部補助「AI報報─AI科普推廣計畫」執行團隊編譯)

views