從機器學習看個人的運動及衛生習慣
機器學習到底可以做到哪些事情呢?你絕對想不到,連「人類習慣」這個行為,都可以透過讓機器學習來分析!過去我們對於習慣養成所需要的時間、因素完全沒有定論,各派都有各自認定的時間。心理學家Buyalskaya等人透過連鎖健身房後臺的資料,以及醫院PFID裝置資料,利用機器學習的方式,分析人們「上健身房」、「洗手」行為的養成時間,以及影響的因素等,嘗試破除大眾對於「習慣養成」的迷思。
撰文|王冠云
建立一個習慣到底需要多少時間呢?21天?40天?3個月?相信各位也看了不少坊間流傳的各種神奇數字。一群心理學家們使用機器學習的方法,從大數據資料來分析人們去健身房運動以及在醫院中洗手的習慣,他們發現,環境脈絡的眾多因子會影響到習慣養成的速度以及堅固度。
什麼是習慣?
心理學家或神經科學家們定義習慣是一種決策過程,這個過程讓個體在相同的脈絡之下,皆會有相同的行為,且不論結果為何,都會發生。而所謂的脈絡,指的是環境中的感官刺激、地點、先前的行為等等。不過,習慣是一種漸進式養成的過程,所以在不同的人、環境線索以及行為當中,應該會存在不同的習慣養成的速度。
至於習慣究竟如何養成、速率為何、影響的脈絡因子有哪些,就是Buyalskaya等人 (2023) 想透過機器學習及大數據來分析的課題。有鑑於過往研究較少關注於實驗室以外真實人們的習慣養成數據,在他們的研究中,都使用了很大量的真實數據,共有兩個子研究。子研究一收集了超過三萬人的健身房參與資料(合計1200萬筆觀察資料);子研究二則收集了三千多人在醫院中的衛生習慣資料(合計4000萬筆觀察資料)。
上健身房的習慣養成
有關健身房的出席次數,Buyalskaya等人 (2023) 收集了北美一家連鎖健身房的後臺資料,總共有橫跨了14年,超過1200萬筆的會員資料可供分析。資料包含了去健身房的時間、健身房的地點以及該健身房據點的設施資料。藉由這些資料,再進一步的推算出每一位會員每週上健身房的次數、入會時間等等資訊。
研究所使用的演算模型是LASSO回歸(least abosolute shrinkage and selection operator,最小絕對值收斂和選擇算式),特色在於它可以基於個人的各項行為指標,產生一個特定個人的數值,而且不需要預先設定統計假設。其所產生的個人數值,又稱為個人行為的可預測性 (predictability),範圍介於0.5到1之間,0.5代表完全隨機,1則代表完全可預測。
模型計算的結果發現,所有個體的平均可預測度是0.806,大致可說是可預測的。在模型的設計上,每一個當日是否會進健身房運動的可能性,是由那個當日追溯的過往紀錄來預測。在各個預測因子中,對模型而言最重要的因素是前一次去健身房的時間與當日的間隔。再者,還有是否為「星期一」或「星期四」,以及前7日去健身房的次數等等。而之所以會出現特定的星期,推測應該和個人的工作行程有關,所以即便只是星期一與否,也會影響到模型的預測。而每個個體對於健身房習慣的養成也有所差異,要形成去健身房的習慣大約需要68至77天。
另外,研究者也加入了酬賞條件的變化,例如好天氣與壞天氣因素是否會影響健身房的出席率。結果發現,若是高可預測性的健身房會員,對於酬賞的反應並不會產生特別的變化,也就是「酬賞貶值 (reward devaluation)」,即使有更好的酬賞來獎勵他們去健身房,但固著的習慣使他們對於酬賞變化的反應敏感度不因此特別升高。
洗手的習慣養成
至於手部衛生的習慣資料,則是透過醫院職員所配戴的RFID裝置來進行資料統計。在Buyalskaya等人 (2023) 的研究中,取得了30間醫院,超過5000名職員的在一年間的資料,總共有4000多萬筆資料可供分析。
這個RFID裝置會監測每一個在需要洗手的機會中,該職員是否有執行洗手的動作。收集用來提供給模型進行預測的變項中,包含時間點、醫院名、房間地點等。與健身房的習慣預測相同,也是使用LASSO回歸進行預測。
預測結果發現,對於模型而言最重要能預測該員是否洗手的預測因子是「順從度 (compliance)」,即前一次洗手的時機點,是否依照醫院的規定進行洗手。若是前一次有遵守醫院規定,通常在當下的那一次,也理當會依照規定洗手。另外,其他重要的預測因子還包含上一次排班的時間、房間的進出(離開時洗手比進入時洗手的機率要大)等。
手部衛生的模型則是平均得到了0.788的預測值,也代表了醫院職員的洗手習慣若干程度的可預測性。而洗手習慣的養成,大約經過9-10個班次,或是大約220次的洗手之後,就能預測下一次的洗手。這樣的速率是比上健身房的習慣養成還要更快的。另外,酬賞方面,研究者假定離開醫院應該會更能誘使職員們洗手,但實際發現卻沒有顯著差異。
破除習慣養成的迷思
綜上所述,Buyalskaya等人 (2023) 指出,在他們的調查中有三項重要的發現。第一,環境脈絡的因素對於某些人而言,更能預測他們的習慣養成行為,而且透過LASSO模型,研究者們也試著分析出最能預測行為的因子;第二,和一般大眾流行的說法不同,其實並沒有習慣養成的「魔法天數」,畢竟上健身房的習慣和洗手習慣的養成時間大不相同;第三,對於習慣養成已經很定型的個體而言,他們對於酬賞的敏感度會降低,對於行為介入的反應會較弱。不論是在健身房還是在醫院,對於已經養成的習慣,其實不會有太多的酬賞或獎勵會改變固定的行為。不過,由於技術上的限制,Buyalskaya等人 (2023) 也提醒讀者,還是有可能有其他影響習慣的因素是沒有被觀察到的,仍有待進一步的確認。
參考文獻
- Buyalskaya, A., Ho, H., Milkman, K. L., Li, X., Duckworth, A. L., & Camerer, C. (2023). What can machine learning teach us about habit formation? Evidence from exercise and hygiene. Proceedings of the National Academy of Sciences, 120(17), e2216115120.
- TEJ台灣經濟新報-LASSO回歸模型