世界上14%的樹種還沒被發現?利用統計量估計地球樹木的物種多樣性

世界上有多少種類的樹,是相當大尺度的問題,2022年,一篇研究利用GFBI(Global Forest Biodiversity Initiative)及TREECHANGE資料庫,以及生物多樣性的chao2統計量,估計出地球上的樹種推估量。此結果說明,地球上約有73,000種樹木,其中約有9,000餘種尚未被發表或描述過。以洲的尺度可發現,南美洲的生物多樣性最高,潛在的未發表物種也最多。

撰文|何郁庭

圖一、長年以來,世界上有幾種樹木一直是人們感興趣的問題|來源:pexels

2022年,一篇發表在《Proceedings of the National Academy of Sciences》期刊上的研究指出,根據估計,地球上大約有73,000個樹種,其中大約有9,000餘種都還沒被發表或描述過。

世界上有幾種樹木,一直是人們感興趣的問題,為了知道問題的答案,擅長外業調查的學者,孜孜矻矻地蒐集現地觀測資料;對理論及統計擅長的學者,則鍥而不捨地推導出能客觀估算生物多樣性的公式和模型。統計方法和調查取樣的技術不斷推陳出新,促成了這項研究成果。

了解研究估算出來的「結果」很容易,但是要了解「如何估算」,反而要花些工夫才能理解其根據與邏輯。本篇文章,正是想介紹這篇研究估算物種數的原理與細節。

 

● 全球樣區資料來源

若要計算統計量,首先必須要有地面樣區的觀測資料。

此研究使用GFBI(Global Forest Biodiversity Initiative)及TREECHANGE兩個全球資料庫的資料。GFBI是全球性的樹木樣區調查資料,具有樹種相對豐度的資訊(abundance-based),且包含9,353個100 km2的樣區,此資料庫共記錄約3千8百萬株樹木,並包含約2萬8千種樹種;TREE-CHANGE的資料庫則是包含樣區資料及引證標本(botanical voucher)資料,記錄物種是否出現的資訊(occurrence-based),此資料庫約有3千7百萬筆資料,並包含5萬種樹種。

這兩個資料庫的地面調查範圍皆橫跨五大洲,且樣本涵蓋率達到96.4%[1];扣除重複的物種,兩個資料庫共記載64,088個樹種。以取樣的數量而言,算是充足,然而從取樣地點的位置來看,或多或少可發現取樣不均勻的情況。[1] 樣本涵蓋率(sample coverage),指在樣本中,看到所有物種的可能性。

圖二、樣區分布及各大洲樣本數/物種數對照圖。地圖中藍色區塊為GFBI樣區位置,紫色為TREECHANGE樣區位置|來源:文獻1

 

● 估計的方法及其原理

了解資料庫的資訊後,接著要說明的則是用來估算物種數的公式。

此研究主要使用名為「chao2」的無母數估計量(nonparametric estimator)。這個統計量是其他生態學者以清華大學的榮譽退休教授趙蓮菊教授的姓氏命名,此統計量最原始的概念是源於計算機科學之父圖靈(Alan Turing)於第二次世界大戰時,為了估算截獲德軍電報密碼的數量而出現。

此估計法的簡要原理,是將取樣中發現的物種數,加上取樣中未發現的物種數,則總數即為該地實際的物種數;取樣中發現的物種是已知,所以要估算的僅有「未發現的物種」。若每一個物種為第i個物種,則樣區調查中發現的機率設為πi,那麼沒有被發現的機率則為πi;進行T次調查後完全沒有被發現的物種,也就是沒有被發現任何一次的物種(Q0)期望值則為:

依此原則,可估計出Qk的期望值。

 

在所有樣本中,豐富種會在取樣中出現很多次,然而不容易被看見,需要被推估的,則是那些僅出現1次、2次的稀少物種,因此,在樣本當中,僅出現一次(Q1, singleton)、兩次(Q2, doubleton)的稀少種,是估計時的重要參數。經過數學運算的推導,即可得到物種數的估計量及公式:


Sobs:在所有樣本中觀測到的物種數

T:樣本單位;樣區數

Q1:在所有樣區中,只出現1次的物種個數

Q2:在所有樣區中,只出現2次的物種個數

 

這是一種可以利用樣本資料,推估母群體到底有多少物種的估計方式,而這樣的估計方式,不僅可以用在生物多樣性,也可以用來估計環境學中之污染物的濃度[2]、考古學上文獻遺留的比例[3],甚至是莎士比亞腦中的詞彙量[4]

 

● 研究結果與討論

回到研究的主軸,依照上述的資料及計算方式,研究的成果得以討論(1)全球-洲際-生物區系等三個尺度的物種多樣性,(2)世界上森林中的稀少樹種,以及(3)各大洲物種比較。

圖三、全球(A)及洲際(B)物種多樣性估計值。(A)黑色實線是利用內插法獲得的物種數,虛線為外推法獲得的預期物種數,深灰色為95%的信賴區間,紅色虛線為利用Q1估計出的真實數值。(B)北美、南美、歐亞大陸、非洲,及大洋洲的物種多樣性估計值。|來源:文獻1

 

同開頭所說,根據研究推估結果,世界上的樹種約有73,000種(圖三),而從洲的尺度來看,多樣性又以南美洲最高(Sest=31,112),其次為歐亞大陸(Sest=16,264);若從生物區系(biome)的尺度討論,物種多樣性最高的地區不外乎是雨林(tropical)與常綠闊葉林(subtropical moist forest),不過,溫帶森林與乾旱林,甚至是非森林地區(如高山草原、灌叢、沙漠),也具有相當程度的多樣性。[5]

圖四、以生物區系尺度估計樹木的物種多樣性。|來源:文獻1

 

而稀少種的部分,以全球尺度而言,稀少種的物種數占比約33%,以洲的尺度來看,非洲(38%)與南美洲(37%)具有最高比例的稀少種。已被記錄的稀少種在資料庫中,大多都是樣本數僅為1或2的物種,在生物學家有更精細的研究結果發表前,我們甚至很難知道些稀少樹種的確切族群大小與分布範圍。

最後,關於各洲之間物種的比較中,五大洲共有的樹種僅占比不及0.1%,共享物種比例最高的為北美洲-南美洲,其次則為歐亞大陸-大洋洲;而以獨特性而言,南美洲具有最高的特有種(endemic species)比例估計值(49%),這些數據可以間接做為生物地理學的佐證依據。

了解世界上的生物多樣性,可以幫助我們知道自己生活在怎樣的環境中;森林是維持地球上生態系平衡中相當重要的角色,了解森林及其多樣性,可以說是人們學習永續及維護生態系統的基石。

藉由許多生態學者和統計學者的努力,才有了現在全球樹木資料庫和生物多樣性推估模型的成果;而我們得以更加接近問題的真正答案。

 

 

註解:

[1] 樣本涵蓋率(sample coverage),指在樣本中,看到所有物種的可能性

[2] 估計環境學中之污染物的濃度 https://doi.org/10.1029/WR017i001p00243

[3]估計考古學上文獻遺留的比例 https://spec.ntu.edu.tw/20220426-research-math/

[4] 估計莎士比亞腦中的詞彙量 https://doi.org/10.1093/biomet/63.3.435

[5] 參原文獻附件 1 之表 2 https://www.pnas.org/doi/10.1073/pnas.2115329119#supplementary-materials

 

參考資料:

  1. Gatti, R. C. et al. (2022) The number of tree species on Earth. Proc. Natl Acad. Sci. USA 119 (6) e2115329119. https://doi.org/10.1073/pnas.2115329119

  2. Chao, A. and Chiu, C. H. (2016). Species richness: estimation and comparison. Wiley StatsRef: Statistics Reference Online. 1-26.  DOI:10.1002/9781118445112.stat03432.pub2

  3. More Than 9,000 Tree Species Await Scientific Description. The Scientist (Website). 2022-2-1. https://www.the-scientist.com/news-opinion/more-than-9-000-tree-species-await-scientific-description-69665

views