多變多巴胺——第一部:ChEBI:18243
多巴胺是什麼?如果一張圖就能告訴我們許多多巴胺知識,而且,這些知識是由許多科學家合力建立完成的;如果一張圖就能提供多巴胺關鍵的連結,對於我們快速掌握多巴胺的資訊結構有多大幫助?試試看,透過多巴胺在一個知識庫中有一個身分證號碼:18243,ChEBI知識本體,開始帶領我們透視化學多巴胺與連結即時更新的豐富資源探索旅程。
撰文|A. H.
繼《多變多巴胺——前傳》得知多巴胺的知識內容涵蓋多變面向,會因時空變化而變化,因觀察角度不同而不同。通常開始介紹多巴胺時,會說明「她」是兒茶酚/兒茶酚胺和苯乙胺家族的有機化學物質。但先等等,突然出現的這麼多化合物名稱是什麼?這一脈的科學家族祖譜又是怎回事?對於複雜的資訊,我們可以利用整合知識單位廣度和深度的利器,也就是所謂的知識圖譜 (Knowledge Graph, KG) 與釐清知識間架構與「關係」的知識本體 (ontology)。這裡提到的本體,原是由各學門學者所建立,提供電腦「理解」資料語意來運算,以機器可讀的通用格式進行描述,整合其他知識來源應用於不同領域的方法。
大家最熟悉的KG莫過於Google搜尋結果右側顯示的資訊框了。作為一個理解現實世界的實體 (entity) 及其彼此關係 (relation) 的圖框,目前最常出現的就是結構化資料庫——維基百科的資訊,而這背後的智慧其中之一,就是來自本體的語意架構【1】,【2】。若將本體放在科普脈絡中,則有助於我們快速掌控資訊,也就是所謂一圖勝千言。因本體具備了將資料可視化、結合圖像與文字知識樹的優勢,協助讀者從熟悉的視覺表現,進入抽象科學理解,因此接下來我們將嘗試使用不同的本體,來傳達多巴胺複雜的故事,帶領讀者分別從微觀和宏觀的角度獲得多巴胺概念,並更準確地理解「她」的屬性、結構和基本知識。
知識本體ChEBI
以生物醫學本體而言,每個知識單元(實體或節點)代表的是特定的生物或化學實體(如基因、細胞、疾病、藥物等),提供了每個化合物重要的特徵。本體中,每個連結的邊 (relation) 則是描述實體間的相互作用或關係(如「藥物治療疾病」或「細胞上調基因」)。因此,以使用標準詞彙的「生物感興趣的化學實體」 (Chemical Entities of Biological Interest, ChEBI) 作為正式瞭解多巴胺的入門,相當符合我們對多巴胺分子結構、在生物學中的作用與實體間通用和化學特定關係(如圖2描述的關係類型與家族譜系),同時兼顧了廣泛與深入理解的需求。
ChEBI是總部設在海德堡的歐洲生物資訊學研究所 (EMBL-EBI) 所開放的生物醫學本體 (OBO) 的一部分,專注於整合、闡述「小」化合物的資料。「分子實體」是指任何結構上或同位素上不同的原子、分子、離子、離子對、自由基、自由基離子、複合物、構象異構物等。可識別為單獨區分的實體,所討論的分子實體要麼是自然產物,要麼是用於干預生物體過程的合成產物。ChEBI包含本體分類與指定分子實體,或實體類別與其父母和/或子實體 (parents and/or children) 之間的關係【3】,通常描述為「父子關係」。
ChEBI本體中的多巴胺
多巴胺 (ChEBI:18243) 在ChEBI中的定義為:兒茶酚,其中,4位的氫被2-aminoethyl群取代。18243是ChEBI提供給每個實體的「唯一識別碼」。在圖2中,ChEBI:18243是主族分子實體 (ChEBI:33579) 一族,包含元素週期表第1、2、13、14、15、16、17和18族中,任何一組的一個或多個原子的分子實體。多巴胺在此樹視圖中,可被描述為「是一個」兒茶酚胺 (ChEBI:33567)、單胺分子信使 (ChEBI:25375) 和有機分子實體 (ChEBI:50860)。
然而,多巴胺在化學實體上,還屬於另一分支家族:酚類 (ChEBI:33853)。如圖3所檢視可知,多巴胺也「是一個」多原子實體 (ChEBI:36357)、有機芳香族化合物 (ChEBI:33659),是兒茶酚 (ChEBI:33566)。而在圖1中,亦可得知多巴胺的共軛鹼基和共軛酸是多巴胺 (1+) (ChEBI:59905),是人類代謝反應期間所產生的任何哺乳動物「代謝物」,在生物學上的作用與神經傳導物質障礙有關,後續文章我們會再使用其他的知識本體來進一步介紹。
在ChEBI的一個主要關係類別「has role(具有作用)」中,描述了多巴胺的生物學作用 (ChEBI:24432),包括了β-腎上腺素能激動劑、大腸桿菌代謝物、多巴胺能藥物、擬交感神經劑、小鼠代謝物以及人體代謝物。而應用關係 (ChEBI:33232) 則描述人類對分子實體或其部分的預期用途,因此多巴胺的應用層面包括:強心藥、β-腎上腺素能激動劑、多巴胺能藥物與擬交感神經劑等,亦在本體中有描述與連結。若我們利用ChEBI中的「has part (有部分)」關係查詢,也可找到包含多巴胺結構的化合物,目前至少包括了1372個實體,也可找到59種類似於這種結構的化合物,如圖4所示。
最新版本 (2024/04/09) 的ChEBI收錄了包含近6.2萬化合物和超過19萬筆的「關係」。ChEBI的應用廣泛,包括生物醫學知識圖譜的建置【4】、其豐富層次結構和其他關係類型,可為識別阿茲海默氏症和失智文獻中的化學實體提供治療的協助【5】。那麼最後再問,直接使用ChEBI的多巴胺與大眾直接溝通行得通嗎?當然行!如圖5所示,美國國家醫學圖書館與國立衛生研究院 (NIH) 的開放化學資料庫PubChem,以ChEBI: 18243作為描述多巴胺的資訊來源【6】。另外,新聞媒體介紹多巴胺在疼痛上的作用時【7】,即是直接引用ChEBI: 18243作為資料來源喔!ChEBI所描述的多巴胺是一個化學實體,「她」的「細胞家族譜系」又是一個什麼樣的故事呢?(待續)
參考文獻
- Singhal, A. (2012), Introducing the Knowledge Graph: things, not strings.
- Chah, N. (2018). OK Google, What Is Your Ontology? Or: Exploring Freebase Classification to Underst and Google's Knowledge Graph . arXiv preprint arXiv:1805.03885.
- Degtyarenko, K., De Matos, P., Ennis, M., Hastings, J., Zbinden, M., McNaught, A., ... & Ashburner, M. (2007). ChEBI: a d atabase and ontology for chemical entities of biological interest. Nucleic acids research , 36(suppl_1), D344 D350.
- Fernández Torras, A., Duran Frigola, M., Bertoni, M., Locatelli, M., & Aloy, P. (2022). Integrating and formatting biomedical data as pre calculated knowledge graph embeddings in the Bioteque . Nature Communications, 13(1), 5304.
- Mullin, S., McDougal, R., Cheung, K. H., Kilicog lu, H., Beck, A., & Zeiss, C. J. (2023). Chemical Entity Normalization for Successful Translational Development of Alzheimer's Disease and Dementia Therapeutics . Research Square, rs-3.
- National Center for Biotechnology Information. PubChem Compound Summary for CID 681, Dopamine.
- News Medical. Role of Dopamine in Pain , Aug 21, 2023.
✨延伸閱讀:《多變多巴胺——前傳》