資料也有成本

近年來機器學習的興起,帶起了開放資料的風氣,除民間企業如亞馬遜及Kaggle外,政府也不遑多讓,建立起品質良好的資料開放平台(https://data.gov.tw)。然而,並非所有的資料都適合完全攤在陽光下,例如病患的就醫紀錄與健康狀況。欲將這些資料應用於機器學習,其實存在不少潛在成本,除金錢外,同時也須面對隱私問題以及病患的抗拒與不適心理。如何在有限預算下,追求高準確度,也是資料科學家需要考量的一環。

Read more