從地圖上「看」出肥胖─轉移學習

從地圖上「看」出肥胖─轉移學習

編譯/蕭欣瑜

肥胖問題

肥胖是全球普遍面臨的公共衛生問題。早在1997年聯合國衛生組織便將肥胖視為全球流行病。2017年,美國疾管局的調查,更發現約四成成年國民罹患病態肥胖(obesity,身體質量指數BMI大於30),比例高居已開發國家之首。如何由茫茫人海中縮小範圍,篩選出尤其非遺傳性肥胖的高風險族群,並依此制定衛生政策,將經費與資源作最有效的利用,已是許多公衛研究與調查的重心。

華盛頓大學的兩位日籍研究人員─Elaine Okanyene Nsoesie與Adyasha Maharana─有了新的發想:或可由地圖上看出一城鎮的環境規劃與土地利用,並藉此窺知當地居民的飲食、運動等生活習慣,甚至預估當地的肥胖人口。

別小看地圖上的資訊

這樣的想法並不新穎,只是在網路與資訊普及的現在,這一類的資料已可說是俯首可得。另一方面,AI在圖像辨識與電腦視覺的發展已然十分成熟,可大幅降低圖籍判讀與分類的人力與資源。例如Google地圖上的衛星圖像,可不經由人工先行分類與標記,直接透過卷積神經網絡(convolutional neural networks,CNN)提取環境特徵,AI得以準確辨識當地的綠地、水岸、住宅等地貌,令當地的土地利用規劃一覽無遺。

除了上述的衛星圖像,Google地圖上商家資訊所能提供的資訊量亦不可小覷。例如公園、健身房或運動中心的密度,無形間透露出當地居民的運動習慣、是否有足夠的運動場所與去處。即使某些乍看無關的商家,也可能有著意想不到的關聯,例如:寵物店的密度,某種程度上反映出當地居民飼養寵物的比例。如若飼養中大型犬,便免不了養成散步遛狗或慢跑的生活習慣。只是,兩種圖籍資料,何者才是預測肥胖人口最關鍵也最有效的指標,正是研究的關鍵。

轉移學習看出端倪

為此,研究選擇四個美國城市為樣本:加州洛杉磯(Los Angeles, California)、田納西州孟菲斯(Memphis, Tennessee)、德州聖安東尼奧(San Antonio, Texas)與華盛頓州西雅圖(Seattle, Washington)。共計15萬幅的高解析度Google衛星圖像,未經人工前處理,透過預先訓練好的CNN提取圖像特徵,辨識如綠地、水文、人工建築、道路等地貌,此為資料A;另一方面,研究人員也由Google地圖上下載了上述城市所有的商家資訊,包含健身房、醫療院所、警察局、郵局等在內,共96類「關注場所」(place of interest,POI),此為資料B。這些資料隨後分別轉移予另一AI,用以預測當地的肥胖盛行率(prevalence)。

圖一、轉移學習的架構 ( 來源:A. Maharana et al, 2018. )

這樣的做法,被稱作「轉移學習」(transfer learning):前一個AI將所得出的結果傳授給另一個AI,以完成另一項新的任務或目標。其中被轉移的結果與資料,通常與第二項任務息息相關。在此例中,第一個AI的任務是圖像辨識,並將所提取出的特徵向量轉授予第二個AI,以彈性網路迴歸分析(Elastic Net Regression)篩選出與肥胖最有關聯的變因,並依此「預測」當地的肥胖率。

圖二、由上至下順時針,分別為西雅圖、孟非斯,聖安東尼奧與洛杉磯。各城市左圖為實際肥胖率,右圖為由地景資料所得出的預測值。顏色越深表示肥胖盛行率高,灰色區塊則無資料。( 來源:A. Maharana et al, 2018. )

最後,將由資料A與資料B所得出的預測結果,分別與政府機構在當地的實際統計數據相比較,發現:整體而言,其中資料A,即直接透過AI由衛星圖像中所抽取出的地貌特徵,如住宅形式(「密集集合住宅」或「獨門獨院的房舍」)、取向(「一般住宅」或「靠港、水岸,或帶有自家游泳池的豪宅別墅」)與交通環境(「鐵軌、公路遍布」或「可供行人行走的街道縱橫交錯」),可以更精確地預測當地的肥胖盛行率。推測應與這些地景資料或多或少反映出當地居民的「社經地位」有關,而「社經地位」與「肥胖率」的關聯性,已有多項研究背書。

有趣的是:不同的資料在不同城市的表現不一。例如:在土地規劃上本身綠地較多的西雅圖都會區,憑藉衛星圖像所做出的預測常低估當地肥胖盛行率;而POI在本身肥胖盛行率較高的城市,如德州聖安東尼奧及田納西州孟非斯,反而有較佳的預測力,即使仍然低於衛星圖像所得出的預測。

經濟實惠的調查

過往已有人嘗試類似方法,利用CNN與衛星圖像,以地景樣貌來推估貧窮人口的分布多寡,例如由人口聚集程度與夜間照明密度,來估算當地居民的資產及消費能力,且獲得不錯的成果。如何利用有限資料來推估實情,在政府政策執行力低下、人口普查不易,且缺乏可靠統計數據的發展中國家尤為緊要,而CNN與轉移學習的應用,也讓整個過程更經濟且快速,在在彰顯了AI在諸多領域,甚至政府公衛政策制定、國土規劃上的發展潛力。

 

參考資料

  1. A. Maharana and E. Nsoesie, “Use of Deep Learning to Examine the Association of the Built Environment With Prevalence of Neighborhood Adult Obesity“, JAMA Network Open, vol. 1, no. 4, p. e181535, 2018.
  2. A. Cuthbertson, “AI can predict a city’s obesity levels just by looking at its buildings“, The Independent, 2018.
  3. N. Jean, M. Burke, M. Xie, W. Davis, D. Lobell and S. Ermon, “Combining satellite imagery and machine learning to predict poverty“, Science, vol. 353, no. 6301, pp. 790-794, 2016.
views