異速生長律

出自集智百科
(重定向自异速生长率
跳轉到: 導覽搜尋

目錄

引言

近年來,隨着所謂的“大數據”時代來臨,複雜系統科學研究的基本方法論正在發生着天翻地覆的變化。從早期的純哲學思辨,再到後來的計算機模擬,複雜系統研究終於開始採用“物理學範式”:從實證數據中來,得到一般性理論,再到具體的預測和實驗中去。


物理學範式的一個成功的應用案例就是萬有引力的研究(記得王雄曾經做過一次關於引力理論的講座)。的確,從第谷、伽利略再到牛頓與愛因斯坦,物理學家花費了將近300年的時間,終於將行星運動的觀測數據與完美的數學理論:愛因斯坦廣義相對論聯繫了起來。這就是物理學的範式,一步一步地,雖然舉步維艱,但是終於達到了可以精確預測星體運行的物理學。


在複雜系統研究領域,隨着人們更加自覺地開始利用大量的數據,一些類似伽利略行星三大定律的定量規律已經慢慢地浮現出來。而其中最顯眼的一條普適規律就是我們今天要講的異速生長律了。所謂的異速生長律,就是指系統的兩個宏觀變量X和Y之間服從一個冪律方程:

Y=c X^{\alpha}

其中c和\alpha都是常數。這個方程有其深刻的內涵,目前已被證實適用於從細胞到國家橫跨將近三十個數量級的複雜系統。

生物學中的異速生長律

異速生長(allometry)一詞的來源

下面,我們來詳細介紹異速生長律現象。異速生長律這個詞最早是由生物學家Huxley 和Tessier 在1936年提出的。他們通過研究招潮蟹(fiddler crab)的鉗子大小隨着螃蟹身體而變化,發現了兩者之間的冪律依賴關係,如下圖所示:

Allometry of Biology

(圖1. 該圖摘自異速生長

隨着招潮蟹從小長到大,它的身體在某個時刻t的尺寸(用螃蟹殼的寬度來衡量)是X(t),而它的鉗子的大小(如上圖左圖紅色線段所示)用Y(t)來表示,則這兩個變量之間服從下面的方程:

Y(t)=c X(t)^{\alpha}

在這裡c,a都是常數。如果對上面等式兩邊取對數,則得到:


\log(Y(t))=\log(c)+\alpha \log(X(t))


我們發現,\log(Y(t))\log(X(t))構成了一個對線性依賴的變量。通過將實際測量的螃蟹尺寸數據畫在雙對數坐標軸上,並且用最小二乘法(Ordinary Linear Regression)可以從實際數據估計出參數c和a (如上圖右圖所示)。結果他們發現,實際估計出來的參數a大於1(大概為1.57,為了對比,斜率為1的直線在上面右圖所示),這就意味着如果招潮蟹體積增大了2倍,它的鉗子的體積增長倍數要大於2倍,因此鉗子的增長速度要遠快於它的體積增長速度,這就是異速生長(Allometry或者Allometric scaling)一詞的來源。(參考[1]

Allometry是一個合成詞,allo-表示相異的,而-metry這個後綴則有測量、度量的意思。因此,這兩個詞根合起來就是相異的兩種測量。而這裡的相異又是何含義呢?我們要先理解Allometry的反義詞Isometry一詞,這裡Iso是表示相同的。在上面的例子中,如果螃蟹鉗子的生長速度和它的身體的生長速度是相同的,也就是說冪律指數a=1,那就表示鉗子和它的體積是線性的,它們以相同的速度增長(Isometry)。但是,事實上,我們測量到的真實數據告訴我們,這兩個變量的生長速度並不一致,鉗子快,身體慢,它們兩者不協調,因此,就稱為異速生長。


根據Wikipedia上面的解釋,這裡所說的同速增長Isometry並不一定就等於是線性增長關係,而是一種正常的按照歐幾里德幾何的增長方式。因此,Isometry就成為了一種作為參考和比較的類似於統計上的零模型的東西(Null model)。


比如說,對於歐幾里德幾何體來說,一個物體的面積的增長與該物體體積的增長呈現出2/3的冪律關係,即面積正比於體積的2/3次冪。讓我們考慮生物體,例如人類大腿的截面面積,假如隨着人體積的增長,截面面積呈現了2/3冪次的增長,那麼該截面面積就是同速生長(相比較歐幾里德幾何體來說)。但是如果增長速度不等於2/3,那麼我們就說大腿截面面積的增長屬於異速生長。

各種異速律

在上面的例子中,我們是將同一個生物個體不同時刻的鉗子大小和個體大小兩個變量作為數據點畫在雙對數坐標下得到異速生長律,這種異速生長律被稱之為個體發生異速律(ontogenetic allometry )。我們也可以這樣做:在同一個時間,找來一堆招潮蟹,這堆招潮蟹有大有小,我們將它們的鉗子大小作為一個變量Y_i(i表示個體),個頭大小作為另一個變量X_i,然後將這些數據點畫在同一個坐標軸上。這個時候,我們仍然可能得到一個Y_iX_i之間的冪律關係,但是這個冪律關係描述的是不同個體在同一個時刻的異速生長律。在生物學中,這被稱為靜態的異速律(Static allometry)。


另外,除了研究同一個物種不同的個體在同一個時間截面內的異速律,我們還可以研究不同的物種在同一個時間截面內平均值的異速生長律。前者稱為種內的異速生長律(intraspecific allometry),後者稱為種間的異速生長律(interspecific allometry)。


例如,我們考慮生物體的新陳代謝F和它們的重量M之間的異速生長關係。Max Rubner曾經對狗這個物種研究過這兩個變量之間的關係,由於狗的品種繁多,而且他們的重量M的變化範圍很大,因此畫在雙對數坐標下,會有一個很寬廣的範圍,可以研究種內的異速生長律。他的數據指出,狗種內的異速生長律的冪指數是2/3左右。後來又有人用鳥來做種內的異速生長律,結果也接近2/3。


然而,Kleiber(1932)發現,如果我們研究種間的F與M之間的關係。即找來不同的物種,並測量每個物種多個個體的平均新陳代謝量以及生物體重量,然後將這些數據點畫在同一張圖上,就會得到冪指數為3/4的異速生長律。因此,我們看到儘管是同一對變量,種間和種內的異速生長律冪指數也是很不同的。

3/4冪律——生物中的“開普勒”定律

儘管當前生物學已經積累了超海量數據,定量化研究也是勢在必行。但是筆者認為,在眾多的定量規律之中,Kleiber預言的生物體的新陳代謝和生物量之間的3/4冪律是最重要的一個,也是最接近天體中的開普勒的候選者。


因為Kleiber的3/4定律不僅僅給出了所有不同物種的統一的冪律關係,還指出這些冪律關係具有完全同樣的冪指數3/4,更讓人吃驚的是,這個定律的適用範圍非常廣泛,小到分子、細胞器、細胞,大到鯨魚、大象,新陳代謝與生物量之間的3/4次冪律始終成立。大自然再一次在看似紛亂複雜的生物世界中展示了它的統一的數學之美。


繼Kleiber等在早期針對哺乳動物得到了3/4冪律之後,Geoffery West等人又將這一定律的適用範圍進一步擴大到了微觀生物世界。在2002年的PNAS刊物上的一篇文章《Allometric scaling of metabolic rate from molecules and mitochondria to cells and mammals》中[2]他們指出從完整的生物體,到細胞、線粒體甚至到色素細胞氧化酶分子,在這橫跨了27個數量級的上,所有這些生命現象都遵從同一個指數的3/4冪律。如下圖所示:


Kleiber Law

本圖摘自:Allometric scaling of metabolic rate from molecules and mitochondria to cells and mammals


值得注意的是,對於不同尺度的生物系統來說,雖然他們的冪指數都非常接近3/4,但是這些直線的截距(也就是log(c)卻不盡相同)。這意味着:處於同一條直線上的生物體具有相類似的網絡結構(它們是同一種系統經過尺度變化,不斷擴大出來的,這類似於一個個體從小到大的誠徵)。而處在不同直線段上的生物體卻不一定具有相似的結構。有關Kleiber律以及其它的種間的異速生長律的詳細介紹,請大家參看:《流的探索》。


總而言之,我們可以將各種異速律進行如下的分類:

  • 個體發生異速律(ontogenetic allometry )
  • 靜態異速律(Static allometry)
    • 種內異速律(Intraspecific allometry)
    • 種間異速律(Interspecific allometry)

從城市到國家

城市——創新的來源

異速生長現象如果說僅適用於生物系統,那麼它還不夠普適。但事實上,近期越來越多的研究表明,異速生長方程:Y=c X^{\alpha}是一個相當普遍的方程,只不過在其他系統中,我們一般找不到統一的冪指數a。

例如,當我們研究人類城市的時候,就會發現很多變量都隨着城市規模(人口數)的增長而呈現異速生長方程。而這些變量所對應的冪指數大小不一。例如,在Luis Bettencourt等人的文章《Growth, innovation, scaling, and the pace of life in cities》中[3],作者研究了多種變量與城市人口之間的靜態異速生長關係(同一個時間截面,不同的城市):

Allometric Scaling of Cities

如上表所示,最左邊一列是城市的各種指標(即變量Y),例如一個城市在一年內新申請的專利數量、城市的總產值(GDP)、總的房屋數目、總電量消耗、加油站數目等等。第二列則給出了異速生長方程Y=c X^a中的冪律指數。第三列是擬合優度R^2、第四列是在冪律方程中擬合點的數目,最後一列則指出了不同的數據來源,它們來自美國、中國、德國、歐洲的不同時期。


我們看到,這些變量的冪指數大小雖然都不一樣,但是基本都可以分成三大類:>1,<1和約等於1。這三大類變量依次被稱為超線性增長、亞線性增長和線性增長。冪律指數a的大小反映出了該變量隨着城市的增長所體現出來的規模效應。


從冪律方程Y=c X^{\alpha}中變形,我們可以得到:


Y/X=c X^{\alpha-1}


在這裡,方程的左邊是人均擁有的Y變量(例如人均GDP,人均加油站數量等等)。如果a>1,那麼方程右側的冪指數就大於0,也就是人均擁有的Y變量會隨着城市的增長而增大。如果a<1,則體現為人均Y會隨着城市的增長而減小。如果a~1,就意味着人均Y不隨城市規模而變化。


這又意味着什麼呢?讓我們用GDP作為Y來說明該方程的意義。我們知道GDP衡量的是一個經濟單位在一段時期內創造的總產值。那麼Y/X就表示一個城市的人均GDP。通過實證研究我們得到不同國家的城市的冪律指數都>1(在上表中基本上是1.2左右),也就意味着人均GDP會隨着城市規模的增長而增長。


在中國,每年都會有大量的人口湧進像北京、上海這樣的大城市,在全世界,超過一半的人口是居住在城市的,而且這種比例還在增大。為什麼會出現這種情況?人們為何希望聚集到大城市呢?通過方程Y/X=c X^{0.2}我們不難看到,這是因為城市越大,人均產出(或者等價地即為人均收入)會隨着城市規模的增大而增加。所以,城市越大就意味着平均來說每個人的收入就會增加(暫時忽略貧富之間的差距),所以很多人更願意居住在大城市。


讓我們再來看一個變量Y為石油銷售量。在表中,這個變量的冪指數a<1,這意味着隨着城市的增大,人均所消耗的石油在減少。因此,人們聚集在一起形成大城市實際上是一種更加經濟地使用石油資源的方式。


總而言之,根據該表格,很多與創新、財富增長有關的變量都具有超線性關係,而與能量、資源消耗有關的變量都呈現出亞線性關係,這些都說明了城市是一種具備規模經濟效應的有機體。當然,城市規模的增加也有負面效應,例如,人均犯罪數量、人均艾滋病感染數量也都會隨着城市規模的增加而增加。

國家的異速生長

以上,我們介紹了生物以及城市中的異速生長現象。但是這些都是別人的研究。下面,我就來講講我自己做的研究。即在更大的國家尺度上來探索異速生長律。以下討論主要基於我們已發表的一篇論文[4]


我在2007年左右寫作《流的探索》系列文章的時候就開始對異速生長定律這塊非常感興趣。但是經歷了3年多的時間,才發表了第一篇這方面的論文。原因就是,要做這種研究,最重要的是找到實證數據。而對於以前從沒有接觸過數據的我來說,這件事情還真的形成了一道門檻。不過,幸運地是,我意外地發現,原來我安裝的Mathematica 6.0軟件之中就包含了大量的數據。其中,Mathamtica中有一個命令叫做CountryData。利用它,你可以利用自己的PC機連接到一個Wolfram公司提供的龐大的在線數據庫,從而訪問世界各國各方面的數據(包括地理、人口、經濟、貿易等)。有了這個大的數據庫,我就可以展開大量的關於異速生長律的研究。


在這個研究中,我們對273個國家或地區的104個數值型的變量進行了系統性的靜態異速生長律研究。首先,我們將所有這些變量劃分成了兩類:1、廣延型的變量;2、強度型變量。在物理中,所謂的廣延型變量是諸如能量、質量、熵等具有子系統可加性的變量。在國家中,一些宏觀總量,如人口、GDP、面積、出口、進口等都屬於廣延型變量。而平均的人均GDP,人口的生育率、死亡率等類似於物理中的溫度、壓強被稱為強度量。


對於廣延性的變量,我們分別研究了它們和三種不同的國家尺度變量(分別是地理尺度,即國土面積、人口尺度,即總人口和經濟尺度即GDP)做異速生長律分析,即探索Y=cX^a是否成立,這裡X是面積、人口和GDP這三種不同的尺度。Y是各種廣延性變量。


我們得到了一些有趣的結論如下:


1、國家作為更大的經濟體與城市呈現出明顯的差異


例如,如果我們仍然研究人口和GDP這兩個變量的異速生長關係,就會發現雖然Y=c X^a這個方程仍然成立,但是冪指數a會非常接近於1,而不是大於1,也就是說,對於國家來說,GDP和人口近似呈現出線性的關係。如下圖:

Allometric scaling between population and GDP among all countries

在這張圖中,每個數據點都表示一個國家。紅色的直線和黑色的虛線分別是用普通最小二乘法和主軸回歸法得到的對異速生長關係冪指數的估計值。在本研究中,我們一般採納主軸法得到的結果(關於不同回歸方法的介紹,我會另外寫文章)。因此,國家的人口與GDP之間的關係呈現線性。


也許你會認為這個數據並不好,噪聲很大,因此統計的顯著性並不高(R^2=0.59),這樣得到的冪指數a的估計會不會不準呢?事實上,我們可以通過選擇不同的屬性來得到更加準確、顯著性更高的人口與產出之間的關係,如下圖:

Refinationofallcountries

我們通過把橫軸的人口屬性用就業的勞動力總數來替代,縱軸用等價購買力重新核算的GDP來代替普通的GDP,我們就會得到統計顯著性更高的異速生長關係(事實上R^2從0.59提高到了0.88),而冪指數始終在1附近,幾乎沒變。我們知道由於世界上不同國家的差異非常大,因此用等價購買力折算的GDP比直接用GDP會更能反映出國家的實際產出能力。而在人口方面,由於並不是所有的人口都處於就業而產生產出的狀態,因此利用就業的勞動力會去除更多的噪音。由此,我們可以確定,對於國家來說,GDP與人口成正比。


由此,我們已經得到了一個與城市截然不同的結論。我們知道在城市中,人口與GDP的關係是超線性的,即隨着城市規模的增大,人均產出會增加。但是對於國家來說,人口越多的國家並不意味着更富裕,即越高的人均GDP(想一想印度和中國這兩個國家,在圖中的最右側的兩個點,就可以知道了)。事實上,我們與Bettencourt的城市文章[3]進行了對比發現了更多的不同:

Comparison between city and country

從這張表,我們可以清楚地知道,隨着人口的上升,城市的人均使用面積會減少,人均產出、電力消耗、感染艾滋病的總數會提高,石油消耗會減少,這體現了城市的規模效應。對於國家來說,隨着人口的增加,人均用地、電力消耗、石油消耗、艾滋病感染都會增加,而人均產出近似不變,這說明,相比較城市來說,國家這種更大規模的系統並不呈現出規模經濟效應。

為什麼會存在這樣的不同呢?很有可能國家相對於城市來說,他的封閉性越差,人口、物品、能量的流入和流出會受到更大的限制。這導致了國家不能形成有效的自組織系統。另外,由於城市屬於人口密集的地區,而國家中大片的土地是處於沒有人口居住的農村地區,所以國家的總產出近似與人口成正比而並非呈現出超線性關係。

GDP會比人口更好地衡量國家的尺度

我們發現,很多宏觀變量都與國家的GDP而非人口形成了顯著性很高的冪律關係,如下表所示:

default

我們看到,從石油消耗、電力消耗到出口總額、進口總額,再到電話線長度、收音機電台個數、互聯網用戶數、公路總長度都可以用國家的GDP得到預測。而且,統計的顯著性R^2都高於0.6。

有幾個冪律關係非常有趣,例如進口總額、出口總額與GDP的關係。如果把國家看作是由貨幣流構成的宏觀系統,那麼進口總額、出口總額類似於國家經濟體的心塵代謝,而GDP相當於經濟體的生物體的存量。因此,出口、入口與GDP的異速生長律可以看作是經濟流的Kleiber律。

另外一個有趣的冪律關係是碳排放(Carbon Emission)與GDP之間的超線性關係。現在一個時髦的詞就是低碳經濟,人們正在想盡一切辦法減少碳排放。但是,根據我們的研究,碳排放是與GDP呈現顯著性很高的超線性關係的,因此GDP越高,碳排放就會越高。這是一種系統性的規律,很難通過個體行為而改變。因此,要抑制更多的碳排放,恐怕唯一的辦法就是減少人類的產出。

最後,我們還研究了各種強度量與人均GDP之間的關係。如下圖展示的兩個例子:

GDP Percapita

隨着國家變得越來越富有(人均GDP的提高),總和生育率下降而平均年齡生高。而且這些強度量與人均GDP呈現了冪律的關係。我們猜想這類冪律關係與人類作為生物體需要進行新陳代謝,因此必然遵循代謝生態學的約束(參看《流的探索》)。

標度律現象

關於異速生長律,我們已經說了很多。但是,熟悉複雜系統研究的朋友可能還知道,除了異速生長以外,近年來,人們還發現了普遍的標度律現象(Scaling)。所謂的標度現象就是大家俗稱的冪律現象,只不過我更喜歡Scaling這個詞,因為它實際上包含了一種系統隨着尺度發生變化而變化的特性,它比直白而膚淺的冪律一次有更深的刻畫。例如複雜網絡中節點度的無標度分布(Scale-free),例如語言中的Zipf律,再如經濟中的Pareto分布,還有生物學中的異速生長標度律現象。

雖然這些實證規律都稱為標度律(或者冪律),但是異速生長律——我們這篇文章重點論述的內容卻與其他的標度律(例如Zipf律Pareto分布等)有着重要的區別。一個明顯的區別就是,異速生長律關注的是兩個變量之間的冪律關係,即:


Y\sim X^{\alpha}


而其它的標度律則關心的是單一一個個變量的冪律分布。例如Pareto定律就在說對於經濟系統中的高收入人群來說,他們的收入X服從冪律分布,即你發現收入在區間[x,x+dx]之間的人的比例是x^{-a}。即:


p(x)\sim x^{-a}


注意這裡只有收入X是我們研究的變量,而p(x)是刻畫變量X分布性質的概率密度函數,所以它是單一變量的冪律。


2012年2月,生物學家M. Stumpf和數學家M.A. Poter在Science上撰寫《Critical Truths About Power Law》[5]一文聲稱很多冪律分布現象(例如複雜網絡中的無標度分布)都不具有統計上的嚴格性,而且其生成機理也缺乏一定的深刻性。相反,異速生長標度律現象則統計意義上更加嚴格而且其機理也是很深刻的。


對於很多實證數據來說,單變量的分布往往不是嚴格的冪律分布,一般多呈現為頭部偏向於指數或者對數正態分布,而尾部的一個小區域才會出現冪律分布(即我們常說的冪律尾現象)。而且很有可能這些數據的真實分布服從穩定分布而非嚴格的冪律分布(參見我的科普文章:《穩定分布與廣義中心極限定理》)。相比較來說,雙變量冪律也就是我們今天重點要說的異速生長法才更接近開普勒定律的地位。

等待牛頓

總結來看,從細胞到國家,無論是生物系統、生態系統還是人類經濟社會系統都遵從相同的冪律方程:


Y=cX^{\alpha}


這就是異速生長律,它是一種橫貫了不同複雜系統的精確而定量的數學方程。在這篇文章中,我們展示了各種各樣的實證數據複合這個方程。但是,究竟為什麼會有這個方程?他的機制是什麼?如果我們把異速生長律比喻成引力中的開普勒定律,那麼我們呼喚複雜系統中的牛頓出現。複雜系統的牛頓力學會是什麼樣子的呢?

參考文獻

  1. [1],Nature文章:Allometry: the study of bioloical scaling
  2. West, Geoffery; William H. Woodruff, James H. Brown (2002). "Allometric scaling of metabolic rate from molecules and mitochondria to cells and mammals". PNAS 99: 2473-2478. http://www.pnas.org/content/99/suppl.1/2473.full.
  3. 3.0 3.1 Luís, M. A. Bettencourt*; José Lobo,Dirk Helbing,Christian Kühnert,Geoffrey B. West (2007). "Growth, innovation, scaling, and the pace of life in cities". PNAS 104 (17): 7301-7306. http://www.pnas.org/content/104/17/7301.abstract.
  4. Zhang, Jiang; Tongkui Yu. "Allometric scaling of countries". Physica A: 4887–4896. http://www.sciencedirect.com/science/article/pii/S0378437110006072.
  5. Stumpf1, Michael P. H.; Mason A. Porter. "Critical Truths About Power Law". Science: 665-666.
個人工具
名字空間
動作
導覽
工具箱