【探索26-7】利用地理大數據追蹤疫情擴散
疫情蔓延時,科學家無法直接追蹤看不見的病原體,卻能藉助人們日常生活移動留下的「數位麵包屑」,迅速擬定傳染病防治的關鍵策略。
講者/臺灣大學地理環境資源學系教授 溫在弘
彙整撰文/呂方雯
●如何追蹤人口移動?
1998 年開始,美國民間有一個「喬治在哪裡(Where’s George)」的計畫,透過建立網站來追蹤累積上億張一元美鈔的地理流動路徑。因為鈔票的移動反映背後「人」的移動與交易狀況,能夠幫助了解區域間的關聯與人的群聚,2009年H1N1大流行時,這筆美金流動資料便曾被用來預測流感的擴散。當傳染病需要分區管制、隔離時,經由紙幣流動資料計算出的區域邊界,就能作為資源調度與劃分管制區的依據。
將視角移到台灣,若分析「人口及住宅普查」項目中的的居住與工作地點,能找出個人通勤行為、建構全台的通勤網絡地圖。當模擬台北市中心爆發群聚感染時,便可以透過通勤地圖,預測疫情會如何隨人群移動擴散到全台,以及不同時間點公衛介入措施的效果。除了人口普查資料,利用健保資料庫的居住地和就醫地,也能計算出各地病人跨區看診的比例,以及各級醫院的病人來源,了解醫療資源在台灣的分布與流動狀況。
●透過空間資料了解群體行為特徵
在人口普查、健保資料庫等官方統計資料之外, 其實有更多資料來自我們日常在搜尋引擎或社群媒體中無意中留下的「數位麵包屑」。舉例來說,人們透過 Google Maps 查看即時交通資訊,同時也回饋旅程資料、優化系統對人類行為的了解與預測,近來地圖上甚至能呈現平時人流量較高的區域,讓使用者除了知道怎麼抵達一個地方,更知道附近可能有哪些值得駐足的商圈。在COVID-19疫情時,Google 也提供社區人流趨勢報告,幫助使用者了解社區雜貨店、醫院、捷運站等各類地點的人流變化、避免在巔峰時段前往人群密集處。而透過分析使用者授權Facebook擷取 的手機位置,溫在弘教授發現雙北地區在升二級警戒之後,跨區移動的比例開始降低,呈現疫情期間的跨區人流隨著遠端辦公的人數變化,但同時平日區內短距離移動的人數卻反而增加。
為了捕捉大台北公共運輸構築成的都市流動趨勢,溫在弘教授的研究團隊用悠遊卡的捷運進出站紀錄,結合民眾旅運交通調查數據,將大台北地區劃分為26個民眾移動規律相似的「生活防疫區」。因為人與人的接觸並非隨機,而是容易和有同樣移動目的的人接觸,在思考人口活動與傳染病的關係時,考慮民眾移動的規律性,能作為阻斷疾病傳播的關鍵。溫在弘團隊劃分的生活防疫區比起原先的鄉鎮市區邊界,能呈現區塊內人群的移動傾向,也可以藉此估計接觸的機率,甚至當需要「封城」時,能作為防止疾病擴散卻又降低經濟活動衝擊的封鎖單位。
●疾病異常趨勢的偵測
除了描繪人口流動趨勢和預測疫情,地理資訊還能幫忙迅速偵測疾病的發生。以透過食物、飲水等方式傳播的食媒性疾病為例,如果一家醫院單天有高出基準值的急診腹瀉個案,有可能是受資料更新與回報流程影響,但如果偵測到相近時空內多家醫院急診腹瀉個案數都明顯增加,則可以推論可能有爆發食物中毒的潛在風險。溫在弘教授曾分析苗栗地區的腹瀉症狀急診資料,偵測到2016年9月11日到18日間部分醫院的急診病患出現異常群聚,但相關新聞報導中衛生局在12日起才陸續接獲民眾反映。由此可見,透過分析疫情時空聚集的特徵,早期偵測出異常訊號,或許便能提早得知疫情爆發並迅速反應、減少波及人數。
若能得到疫情群聚擴散變化的時空特徵,便能掌握更多防治的線索,比如原先的群聚開始分裂可能表示疫情逐漸擴散,群聚變大變小更是涵蓋範圍、嚴重度變化的特徵。溫在弘研究團隊以高雄地區的登革熱資料開發出一套演算法,幫助捕捉疾病擴散的動態特徵與疫情變化,了解哪些區域開始有群聚擴散或合併的現象。為了瞭解疾病擴散動態跟公共衛生介入措施的關係,溫在弘研究室也發展出疫情剖繪分析軟體Epi-Pro,幫助標示需要介入的地點,以及介入後疫情嚴重區域轉移的變化現象。這套預警疫情和分析群聚變化的時空演算法,不僅受到媒體報導,更因為適合用於疫情大規模迅速擴散、無法進行精準疫調的緊急狀況,瑞士洛桑聯邦理工學院的研究團隊便採用該演算法分析2020年COVID-19在日內瓦的群聚擴散過程,協助了解疫情爆發的地點,以及可能的疫情擴散的來源。
在開放資料的趨勢下,許多公務統計數據與去識別化的運輸紀錄(例如悠遊卡出入站紀錄等),大多都可透過申請取得。而社群媒體提供的介接方式,則可抓取更多非結構化的數據,例如對話紀錄、打卡照片等。這些帶有位置訊息的數位麵包屑,並不是系統性地建立,也不是為了研究使用,它們無意間留在網路空間,卻有可能幫助科學家拼湊出人群各種行為的真實樣貌。以傳染病防治來說,借助人群移動的地理資訊,能定量了解疾病分布的時空特徵及進行比較。如果能透過個人留下的打卡位置、移動軌跡、甚至對話與交易紀錄等等「數位麵包屑」,建立去識別化的人流資訊,在了解群體行為特徵與整體趨勢數據背後的規律性後,便能透過分析偵測訊號異常的時間與空間、找出疫情爆發的前兆、追蹤擴散等狀況,進一步連結公衛政策來防止疾病蔓延。
(本文為教育部「人工智慧技術及應用人才培育計畫」