多變多巴胺——第九部:和亦敵亦友的血清素,走走等等?

分享至

塑造我們行為的大腦化學神經遞質,除了名滿四海八方的多巴胺外,另一個赫赫有名的就是血清素了。不過,這是多變多巴胺系列,我們為什麼要提這個和多巴胺同祖輩(單胺)的化學物質?事實上,過去的研究已表明大腦中的神經遞質——多巴胺和血清素,在獎勵學習中均扮演重要角色,我們也知道它們透過影響許多相同的神經迴路來發揮作用。那麼,如何整合多巴胺和血清素訊號來驅動獎勵學習呢?多巴胺和血清素在此過程中,又有什麼樣的關係呢?

撰文|A. H.

圖一:獎勵學習中心伏隔核匯聚多巴胺和血清素|來源:作者與AI協力繪製

以前,我們總是藉由「聯想學習」,透過將刺激(原因)與特定輸出(結果)關聯,進行關察多巴胺參與認知行為中的學習與記憶,並且相信多巴胺已精確的捕捉了神經行為中最重要的多細胞生物過程。不過,科學近期的發展卻讓我們發現和多巴胺對立相互作用,或說敵對關係的血清素 (serotonin),其實它的一舉一動,也會影響全局。

那麼,我們首先快速掌握一下血清素和多巴胺的家族關係。本文先以美國國家醫學圖書館醫學科目標題(MeSH)知識樹簡要說明,待未來專文介紹血清素系列時,再以更詳盡的「生物感興趣的化學實體」(ChEBI)說明。圖二顯示多巴胺(MeSH:D004298或 ChEBI:18243)和血清素( MeSH:D012701或ChEBI:28790)的MeSH知識樹概況,二者均隸屬生物單胺家族,而血清素則為色胺類子輩(註一)。

圖二:多巴胺和血清素的MeSH知識樹|來源:作者提供

若從神經科學史上觀察,理論層面的敵對關係或對立假說 (opponency hypothesis) 具有悠久歷史。在實際形式中,敵對關係使用兩個系統對事件(如情感事件)進行編碼的簡單想法開始,一個系統報告積極反應(食慾事件),另一系統則報告負面反應(厭惡事件),以及系統間相互抑制和/或對共同輸出的相反影響。從生理學角度來看,這的確巧妙地規避了負面影響的缺失。而血清素和多巴胺間的對立相互作用,在此假說中即是兩者作為對立力量來平衡我們的決定: 多巴胺敦促立即採取行動,而血清素則相反的建議我們要有耐心。換句話說,多巴胺鼓勵行為,而血清素抑制行為,以幫助生物做出正確選擇並規避風險。

另一種理論稱為綜效假說 (synergy hypothesis),認為多巴胺處理短期獎勵,而血清素則管理長期利益。假設多巴胺和血清素分別攜帶有關短期和長期時間尺度上的獎勵期望訊號,從而綜合了關於多巴胺在時間差異學習中的功能、以及血清素在調節情緒中的作用。在此二大理論假設的背景下,過去因技術上無法在單獨受試對象中精確的操縱多個神經調節系統,致使這些假設均尚未得到直接的驗證。

圖三:多巴胺和血清素的亦敵亦友關係|來源:作者與AI協力繪製

近期史坦福大學的一項新研究,2024年11月25日發表在《自然》以「對手透過紋狀體的多巴胺和血清素控制強化(學習)」為題,首次展示了新的實驗方法和模型,直接驗證了多巴胺和血清素如何一起工作,且是以「相反的」作用,來共同塑造我們的行為。此研究團隊開發了同時存取多巴胺和血清素系統的遺傳策略,新小鼠模型運允許科學家在同一隻小鼠中獨立觀察和研究多巴胺和血清素系統。

在實驗案例中,團隊首先針對同一小鼠大腦中的多巴胺和血清素神經元,採用不同的螢光蛋白標記(紅色和綠色)。然後,尋找其他大腦區域中紅色和綠色軸突間的重疊,以釐清多巴胺和血清素訊號在哪裡匯聚的問題。結果確定紋狀體的一個子區,伏隔核 (nucleus accumbens, NAc) 後內側是匯聚多巴胺和血清素輸入的熱點區域。其次,針對小鼠執行簡單的獎勵學習任務,檢測這些輸入的神經遞質活動是什麼樣的情況。透過多種實驗方法,研究一致發現了同樣的事情:當小鼠消耗獎勵時,多巴胺上升,血清素下降。

為了測試這些訊號對於學習是否是必要的,研究使用光遺傳學(一種利用光來控制轉基因神經元的技術,在獎勵學習過程中,能選擇性地減弱每個系統的正常訊號傳導——無論是單獨還是組合),來阻斷多巴胺和/或血清素獎勵反應。結果表明失去兩種神經遞質系統獎勵反應的小鼠,完全無法學習提示-獎勵的關聯,而人工重新創造多巴胺和血清素獎勵反應,則比單獨的任何一種操作更有效地推動學習。也就是說,二個神經遞質系統同時執行「多巴胺刺激」與「血清素抑制」時,比單獨對多巴胺刺激的結果更為強化幫助大腦從獎勵中學習。

圖四:當小鼠消耗獎勵時,多巴胺上升,血清素下降|來源:作者提供

最後在規範獎勵中心伏隔核中重複關鍵的實驗,發現多巴胺和血清素協同工作,但是它們二者是以相反的方式,幫助大腦從獎勵中學習。此研究驗證了多巴胺和血清素之間,長期假設的對手關係,並且表明這種對手關係控制著聯想學習中的獎勵和強化。該研究的新聞稿中亦指出,根據此研究,多巴胺和血清素這兩個系統作用有點像汽車的「加速器和制動器」。多巴胺通過在事情比預期好時,發出訊號來鼓勵尋求獎勵行為,從而產生“開始”的訊號。相對之下,血清素似乎阻止了這個過程,而產生了「停止」或「等待」的訊號,因此可能會幫助我們更有耐心,考慮長期後果,而不僅僅是立竿見影的回報。臨床上如成癮治療中,可能設抑制過度活躍的多巴胺訊號傳導,同時提高血清素的活性。而在抑鬱症的治療,則可能增強這兩個系統以提高動機和長期規劃。

如此一來現在我們知道,學習需要同時來自多巴胺的「走 (Go)」訊號來驅動尋求獎勵,和來自對手血清素的「等 (wait)」訊號充當煞車機制,促進耐心並考慮長期利益,以便生物體正確評估和應對有價值的機會。也就是閱讀本文的此刻,多巴胺和亦敵亦友的血清素,在大腦獎勵學習的機制中,正在以過去我們不知道的方式相互作用發出訊號:「多巴胺刺激」與「血清素抑制」,走走等等,一起幫助我們有效的學習多變多巴胺。

 


註釋

註一:「聯想學習」參閱《多變多巴胺——第五部》圖三的神經行為本體論知識樹。「生物感興趣的化學實體」(ChEBI)參閱《多變多巴胺——第一部》。

 


參考文獻

  1. MeSH:D004298ChEBI:18243
  2.  MeSH:D012701ChEBI:28790
  3. Cardozo Pinto, D. F., Pomrenze, M. B., Guo, M. Y., Touponse, G. C., Chen, A. P., Bentzley, B. S., ... & Malenka, R. C. (2024). Opponent control of reinforcement by striatal dopamine and serotonin. Nature, 1-3.
  4. Weiler, N. Dopamine and serotonin work in opposition to shape learning., Neuroscience News, Stanford University. Nov 25 2024.
(Visited 146 times, 15 visits today)

分享至
views