冪律分佈

從 集智百科
跳到: 導覽搜尋

該詞條由 靠倒立解氣 翻譯編輯,由高飛審校,張江總審校,翻譯自Wikipedia詞條Power_law

一個冪律圖示例,展示了人氣排名的規律。右側是數量龐大但人氣微弱的「長尾」,左側則是少數「主宰」。 (又稱80–20法則)。

統計學中, 冪律是兩個量之間的函數關係,其中一個量的相對變化會導致另一個量的相應冪次比例的變化,且與初值無關:表現為一個量是另一個量的冪次方。例如,正方形面積與邊長的關係,如果長度加倍,那麼面積擴大四倍。[1]


目錄

實例

各種各樣的物理、生物和人造現象的分佈在大致遵循着冪律,涉及範圍極其廣泛,包括月球表面月坑的大小,太陽耀斑的強度,[2] 各種物種的覓食模式,[3] 神經元集群活動模式的規模,[4]大多數語言的用詞頻率,各種姓氏的頻率,生物各種演化支(clade)的物種豐富度,[5] 停電的波及範圍,每個罪犯的刑事罪名指控,火山噴發,[6]人類對刺激強度的判斷[7][8] ,等等[9]

不過很少有經驗分佈符合完整的冪律分佈,更確切地說,他們通常是遵循冪律尾部的規律。在許多複雜介質中,聲衰減(Acoustic attenuation )遵循寬頻帶內的頻率冪律;揭示生物變量之間關係的異速標度律(Allometric_scaling)是自然界中已知的最著名的冪律函數之一。

性質

標度不變性(Scale invariance)

冪律的一個屬性是它們的標度不變性。給定一個關係f(x) = ax^{-k} ,將參數 x標度一個常量 c 只會導致函數本身的比例標度,公式表達為:f(c x) = a(c x)^{-k} = c^{-k} f(x) \propto f(x),此處,\propto 表示成正比(正比例)。也就是說將參數標度常量c,那麼對應原始冪律關係乘以常量{c}^{-k} 。因此, 所有具有特定標度指數的冪律都等效於常量因子(的標度), 因為每個冪律函數都只是其他情況的縮放而已。

如果我們取用兩者(f(x)x)的對數,會得到一個線性關係,呈現在雙對數圖上就是一條直線,這通常被看作冪律的標誌。對於實際數據, 這種線性是冪律關係數據的必要條件, 但並不是充分條件。實際上, 有許多方法可以生成模擬此指數行為的有限數量的數據, 但在它們的漸近極限中, 不是真正的冪律 (例如, 如果某些數據的生成過程遵循對數正態分佈)。因此, 準確地擬合和驗證冪律模型是統計研究的一個活躍領域;詳見下文。

缺失完備定義的均值(Lack of well-defined average value)

僅當 k > 2 x^{-k}x \in [1,\infty)具有完備定義的均值 ; 當k >3 時,x^{-k} 具有有限的方差;

自然界中, 大多數冪率分佈的指數使得其具有完備定義的均值(K>2嘛),但是方差不是有限的,這意味着它們有可能成為「黑天鵝」行為[10]。下面這個思維實驗[11]呈現了這個想法: 假設你和你的朋友一起在一個房間里估算平均月收入,然後世界上最富有的人進入房間,他每月收入約10億美元,那麼房間里的平均收入會怎麼樣?

我們又將收入分佈服從冪律現象稱為帕累托分佈(例如,美國人的資產凈值服從指數為2的冪律分佈)。一方面,這使得應用基於方差和標準差的傳統統計(例如回歸分析)失效。另一方面,這或許可通過採取有效的干預手段解決一些問題[11],例如,可以應用到管理汽車尾氣排放,這個問題服從冪律分佈(極少數汽車導致大多數污染),那麼理論上從道路上消除那些極少數汽車就足以減少總排放量。[12]


然而,冪律分佈的中位數確實存在: 對冪律x^{-k} ,與指數k > 1,它取 21/(k – 1)xmin,其中xmin時冪律所適用的最小值。[13]

普適性(Universality)

冪律與特定標度指數的等價性在產生冪律關係的動力學過程中有更深層次的淵源。 例如, 在物理學中, 熱力系統中的相變與某些量呈現冪律分佈有關, 它們的指數被稱為系統的臨界指數( critical exponents)。具有相同的臨界指數的不同系統——即它們在接近臨界狀態(criticality)時顯示相同的標度行為——可以通過重整化理論來證明,他們的基本動力學相同。例如, 水和 CO2 在沸點上的行為在相同的普適類中, 因為它們具有相同的臨界指數。 事實上, 幾乎所有的物質相變都是由一小套普適類描述的。對於各種自組織的臨界系統 (self-organized critical), 人們也進行了類似的觀察, 雖然不是很全面, 但在這些系統中,系統的臨界點是吸引子。在形式上, 這種動力學的共享性被稱為普適性(universality), 而我們通常認為具有精確相同的臨界指數的系統屬於同一種普適類(universality 5class)

冪律函數(Power-law functions)

科學家對冪率關係感興趣,部分是因為某些簡單機制生成冪率關係所展示出的簡潔性。[14]一些數據冪律關係的演示可以指向特定的機制,這些機制不僅是自然現象的基礎,還可以表明與其他看似不相關的系統之間的深層聯繫; 參見上文的普適性 。物理世界中冪律關係的無處不在, 部分是由於維度的限制[15];而在複雜系統中, 冪律通常被認為是層級或特定隨機過程 的特徵。幾個顯著例子是帕累托的收入分配定律, 分形的結構自相似性, 以及生物系統中的標度定律。研究冪律關係的起源, 並致力於現實世界中對它的觀察和驗證, 是物理學計算機科學語言學地球物理神經科學社會學經濟學等許多領域研究的一個熱門話題。

不過,最近對冪律的興趣主要來自於對概率分佈的研究:似乎有大量的分佈遵循冪律的形式,至少它們右尾是符合的。這些大型事件的行為將這些數量與大偏差理論(theory of large deviations)的研究聯繫起來(也稱為極值理論(extreme value theory)),它考慮了諸如股市崩盤大型自然災害等極其罕見的事件的發生頻率。在統計分佈的研究中更傾向於稱之為「冪律」。

在實際情況中,近似為冪律分佈的情況o(x^k)通常包括一個偏差項,它可以表示觀察到的值\varepsilon的不確定性(可能是測量或抽樣誤差),或者提供一種簡單的方法使觀察偏離冪律函數(可能是因為隨機):y = ax^k + \varepsilon.\!

從數學角度來說,一個嚴格的冪律函數不可能是概率分佈,但一個被截斷的冪律函數的分佈是可能的:p(x) = C x^{-\alpha} ,對於x > x_\text{min} ,指數\alpha (希臘字母 alpha,注意不要與之前使用的標度係數a混淆)大於1(否則尾部具有無限區域), ,最小值x > x_\text{min}是必須存在的。否則,當x接近0時, 分佈具有無限面積, 常量因子C是一個標度因子, 以確保總面積為 1, 這是概率分佈的基本要求。更常見的是使用漸近冪律——只在極限情況下成立。指數通常在 2 < \alpha < 3之間,不過這並不絕對[9]。詳細信息請參閱下面的冪律概率分佈(power-law probability distributions )


示例

從物理學(例如沙堆雪崩),生物學(例如物種滅絕和體重)以及社會科學(例如城市規模和收入[16])中,已經確定了超過一百種冪律分佈。其中包括:

其他形式(Variants)

分段冪律(Broken power law)

初始質量函數的一些模型遵循分段冪律; Kroupa(2001)紅色。

分段冪律是一個分段函數,由兩個或多個的冪律函數組成,再加上一個閾值。例如,有兩個冪律[26]

Broken.png

具有指數截止的冪律分佈(Power law with exponential cutoff)

具有指數截止的冪律就是冪律乘以一個指數函數[27]

f(x) \propto x^{\alpha}e^{\beta x}.

曲線冪律(Curved power law)

[28]


f(x)\propto  {x^{\alpha+\beta x}}

冪律概率分佈 Power-law probability distributions

廣義上,冪律概率分佈是一個密度函數(或離散情況下的概率質量函數)具有以下形式的分佈: 對於較大的x[29]

P(X>x) \sim L(x) x^{-(\alpha+1)}

其中\alpha > 0L(x)是一個慢變函數(Slowly varying function),對於任何正因子r ,它都滿足\lim_{x\rightarrow\infty} L(r\,x) / L(x) = 1L(x)的這個屬性來自於p(x) 漸進的標度不變性。因此,L(x)僅控制左尾的形狀和有限範圍。如果L(x)是常量因子函數,並且我們有一個冪律適用於所有的 x值,在許多情況下,可以很容易地依據冪律假設出一個下限。結合這兩種情況,當 x是一個連續變量,冪律有以下形式:

p(x) = \frac{\alpha-1}{x_\min} \left(\frac{x}{x_\min}\right)^{-\alpha},

其中,frac{\alpha-1}{x_\min}標準化常量因子

下面我們來討論這個分佈的性質。 首先,它的矩可表示為:

\langle x^{m} \rangle = \int_{x_\min}^\infty x^{m} p(x) \,\mathrm{d}x = \frac{\alpha-1}{\alpha-1-m}x_\min^m

m < \alpha -1,定義是完備的; 當m \geq \alpha - 1,發散: 當\alpha\leq 2,均值與高階矩都是無窮大; 當2<\alpha<3,均值存在,但方差和高階矩都是無窮大。 如果從這種分佈中抽取有限樣本,意味着中心矩估計永遠不會收斂——並且隨着數據的增多,他們還有增大的趨勢。這種冪律概率分佈又被稱為帕累托型分佈,具有帕累托尾部特徵的分佈,或是具有規則變化的分佈。

一種不滿足上面的一般形式的修改,即指數截止冪律分佈。

p(x) \propto L(x) x^{-\alpha} \mathrm{e}^{-\lambda x}.

在這種分佈中,指數衰減項\mathrm{e}^{-\lambda x}最終會在較大的x處超過正常的冪律分佈。這種分佈無法成比例縮放,因此並不是冪律;不過,它會在截止前的有限區域內近似地縮放。(注意,一般的冪律分佈是這種分佈的簡單形式,即 \lambda=0的指數截止冪律分佈。)這種分佈是漸近冪律分佈的常見替代方法,因為它考慮了有限大小的影響。

Tweedie分佈是一族統計模型,其特徵是基於可加(additive)與可再生(reproductive)卷積以及標度變換(scale transformation)的閉包(closure)。因此,這些模型都表達了方差和均值之間的冪律關係。這些模型作為數學收斂的焦點,類似於正態分佈在中心極限定理中所扮演的角色。這種收斂效應解釋了為什麼在自然過程中, 方差-平均冪律表現得如此廣泛, 就像泰勒在生態學中的定律和在物理學中的漲落標度[30]。還可以證明,使用擴展箱( expanding bins) 方法時,這種方差 - 均值冪律分佈(variance-to-mean power law)意味着存在1 / f噪聲,而1/ f噪聲可能是由於Tweedie收斂效應(Tweedie convergence effect)而產生的[31]


圖形檢驗法(Graphical methods for identification)

在雙對數圖上呈現直線是必要的,但對於冪律,沒有足夠的證據證明直線的斜率就對應於冪律指數。

雖然人們已經提出了更成熟更穩健的方法,但通過隨機樣本檢驗冪律概率分佈的最常用的圖形方法還是帕累托雙分位圖(Pareto quantile-quantile plots )(或帕累托Q-Q圖),平均剩餘壽命圖(mean residual life plot)[32][33]和雙對數圖(Pareto quantile-quantile plots)(log-log圖)。另一種更強大的圖形檢驗法是利用bundles of residual quantile functions 殘餘分位函數束[34] 。(注意,冪律分佈也稱為帕累托分佈。)這裡假設從概率分佈中獲得隨機樣本,並且我們想知道分佈的尾部是否遵循冪律(換句話說,我們想知道分佈是否有「帕累托尾」)。此處隨機樣本也被稱為「數據」。


帕累托Q-Q圖是這樣繪製的:它將取對數後(樣本)數據的分位數與取均值為1的指數分佈對應的分位數(或標準帕累托分佈的位數)進行比較。如果得到的散點圖表現是「漸近收斂」為直線,就應該懷疑其服從冪律分佈。帕累托 Q-Q圖的局限是它在尾部指數\alpha(也稱為帕累托指數)接近於0時表現不佳,因為帕累托Q-Q圖難以檢驗尾部是緩慢變化的分佈。[34]

另一種檢驗冪律概率分佈的方法是平均剩餘壽命圖,它包含以下步驟:首先對數據取對數,然後將高於第 i 階統計量的數據平均值與第 i 階統計量進行比較繪製,從i = 1, ..., n,其中n是隨機樣本容量。如果繪製出的散點圖走勢呈現為一條「穩定」的水平直線,那麼應該考慮其服從冪律分佈。但由於平均剩餘壽命圖對異常值非常敏感(它並不穩健),所以它通常會產生一些難以解釋的圖形; 而這些圖形通常被稱為 Hill horror plots 。 [35]

雙對數圖是使用隨機樣本以圖形方式檢驗尾部分佈的另一種方式。使用這個方法必須要謹慎,因為雙對數圖中呈現直線對冪律概率分佈是必要不充分條件,許多非冪律分佈在雙對數圖上也顯示為直線[36][37] 。這個方法是將特定數在該分佈中的概率估計量的對數 | 對比這個數的對數 | 進行繪圖。通常,此估計量是該數據在數據集中出現的次數的比例。如果圖中的點在x較大時傾向於「收斂」為直線,則可得出結論,該分佈具有「冪律尾」(power-law tail)。目前這些類型的繪圖的應用示例已經發表[38]。但這種方法的局限是,需要大量的數據才能使結果可靠。此外,它僅適用於離散(或分組)數據。

不過,目前已經提出了使用隨機樣本檢驗冪律概率分佈的另一種圖形方法。該方法包括繪製對數變換樣本的束,是最早提出使用隨機樣本探索矩的存在和矩生成函數的工具,基於殘差分位函數(RQF)(也稱為殘差百分位函數)[39] [40] [41] [42][43][44][45] ,它提供了許多眾所周知的概率分佈的尾部行為的完整表徵,包括冪律分佈與其他類型的重尾,甚至非重尾分佈的分佈。這種方法繪製的圖形沒有上面提到的平均剩餘壽命圖、雙對數圖和帕累托 Q-Q圖的缺點,它們對異常值很敏感,能夠直觀地檢驗具有小\alpha值的冪律,並且不適用於分析大量數據。此外,其他分佈類型的尾部也可以用這個方法觀察檢驗。

繪製冪律分佈(Plotting power-law distributions)

一般來說,冪律分佈是在雙對數坐標軸上繪製的,強調右尾部分。最簡便直觀的方法是通過(互補)累積分佈函數(cumulative distribution function, 縮寫為 cdf)說明:P({x})=\Pr(x>X)


P(x)=\Pr(x>X)=C\int_x^{+\infty}p(X)dX=\frac{\alpha-1}{x_{min}^{-\alpha+1}}\int_{x}^{\infty}X^{-\alpha}dX=\left(\frac{x}{x_{min}}\right)^{-\alpha+1}


注意,cdf也是冪律函數,只是它的標度指數較小。從數據處理角度,cdf的等價形式是rank-frequency 分佈,即先按升序排列n的觀察值,再將它們與矢量\left[1,\frac{n-1}{n},\frac{n-2}{n},\dots,\frac{1}{n}\right]對應.

儘管便於記錄數據,抑或是便於擬合平滑概率密度(質量)函數,但這些方法在數據表示中引入了隱式偏差,因此應該避免[46][47]。另一方面,所述的cdf法對處理這些隱式偏差更穩健(但並非沒有偏誤)並且保留了在雙對數圖形上的線性特徵。雖然在同時用線性最小二乘法擬合冪律時,使用cdf繪製優於pdf(概率密度函數),但其不可避免地在數學上有不準確性。因此,在估計冪律分佈的指數時,建議使用最大似然估計。

從經驗數據估計指數

有許多方法可以估算冪律尾部的標度指數值,但並非所有方法都能產生無偏且一致的結果。一些最可靠的技術通常基於最大似然估計。替代方法通常基於雙對數概率,雙對數累積分佈函數或對數分組數據進行線性回歸,但是,應該避免這些方法,因為它們都可能導致對標度係數的具有顯著偏誤的估計。

極大似然估計(Maximum likelihood)

對取自獨立同分佈的實函數的數據,我們擬合冪律分佈的形式:

p(x) = \frac{\alpha-1}{x_\min} \left(\frac{x}{x_\min}\right)^{-\alpha}

要求x\geq x_\min, 其中係數Z=\frac{\alpha-1}{x_\min} 是標準化常量. 給定x_\min, 則對數似然函數變為:

\mathcal{L}(\alpha)=\log  \prod _{i=1}^n \frac{\alpha-1}{x_\min} \left(\frac{x_i}{x_\min}\right)^{-\alpha}

這種可能性的最大值是通過對參數\alpha進行微分來找到的 , 從而使微分等於零,再重新排列,就得到了估計量方程:

\hat{\alpha} = 1 + n \left[ \sum_{i=1}^n \ln \frac{x_i}{x_\min} \right]^{-1}

其中 對 n 個數據,\{x_i\} 滿足x_{i}\geq x_\min.[2][48].這個估計展示了一個小範圍樣本偏差的秩 O(n^{-1}),當 n > 100時它會比較小。 此外, 這個估計的標準誤是 \sigma = \frac{\hat{\alpha}-1}{\sqrt{n}} + O(n^{-1})。這個估計量相當於從數量金融學和極端價值理論中獲得的需要的 Hill 估計量。 對於一組n值的整數數據點\{x_i\},對每一個x_i\geq x_\min,都有最大似然指數是先驗方程的解:

\frac{\zeta'(\hat\alpha,x_\min)}{\zeta(\hat{\alpha},x_\min)} = -\frac{1}{n} \sum_{i=1}^n \ln \frac{x_i}{x_\min}

其中 \zeta(\alpha,x_{\mathrm{min}})不完整的黎曼ζ函數。這個估計的不確定性和連續方程的公式是一樣的。 然而,這兩個方程是不等價的,連續的方程形式不應該應用於離散的數據,反之亦然。

另外,這兩種估計都需要選擇 x_\min.對於非平凡函數 L(x) , 選擇太小的x_\min\hat\alpha會產生顯著的偏誤 , 選擇過大又會增加\hat\alpha的不確定性, 並且降低模型的統計功效. 所以通常情況下,x_\min的最佳選擇很大程度上取決於左尾的特定形式,以L(x)為代表。

關於這些方法,以及能夠使用它們的條件,可以進一步發現,這篇文章全面而詳細地提供了可用的代碼(Matlab、Python、R和C++)來評估和測試冪律分佈的過程。

詳細代碼如下:

# coding: utf-8
 
# # 用numpy生成0,1之间的幂律分布
# 
# ### 概率密度函数为
# f(x) = a*x^(a-1)
# 
 
# In[241]:
 
 
a = 0.4
# 采样数量
samples = 10000
s = np.random.power(a, samples)
 
 
# In[242]:
 
 
# 绘图展示结果
import matplotlib.pyplot as plt
count, bins, ignored = plt.hist(s, bins=50)
x = np.linspace(0, 1, 100)
y = a*x**(a-1.)
normed_y = samples*np.diff(bins)[0]*y
plt.plot(x, normed_y)
plt.show()
 
 
# # 使用原生方法生成0,1之间的幂律分布
 
# In[250]:
 
 
import math
# 分布函数的反函数
def rev(x,a):
    return math.exp(math.log(x) / a)
 
 
# In[251]:
 
 
# 生成分布
s1 = []
for i in range(samples):
    s1.append(rev(np.random.uniform(0,1),a))
 
 
# In[252]:
 
 
# 绘图
count, bins, ignored = plt.hist(s1, bins=50)
x = np.linspace(0, 1, 100)
y = a*x**(a-1.)
normed_y = samples*np.diff(bins)[0]*y
plt.plot(x, normed_y)
plt.show()
 
 
# # 线性拟合生成结果
 
# In[254]:
 
 
# 统计不同区间的数据数量
divide_num = 100
ys = np.zeros(divide_num)
xs = np.linspace(0,1,divide_num)
for i in range(len(s)):
    ys[int(s[i] * 100)] += 1
 
 
# In[255]:
 
 
# 使用sklearn包中的回归工具
from sklearn import linear_model
# 回归
x_log = np.log(xs)
y_log = np.log(ys)
#线性拟合数据准备
X_para=[]
Y_para=[]
for x ,y in zip(x_log[1:],y_log[1:]):
    X_para.append([float(x)])
    Y_para.append(float(y))
# 使用sklearn的线性拟合函数进行拟合
regr = linear_model.LinearRegression()
regr.fit(X_para, Y_para)
 
 
# In[256]:
 
 
# 
plt.title("fit the log data")
plt.scatter(x_log,y_log,color = "black")
plt.plot(X_para, regr.predict(X_para), color='blue',linewidth=3)
plt.show()
 
 
# # ks检验
 
# In[155]:
 
 
from scipy.stats import kstest

Kolmogorov–Smirnov估計

另一種計算冪律指數的方法,它不使用獨立同分佈數據,使用的是Kolmogorov-Smirnov統計量的最小值, D,在數據的累積分佈函數和冪律之間:

\hat{\alpha} = \underset{\alpha}{\operatorname{arg\,min}} \, D_\alpha

且:

 D_\alpha = \max_x | P_\mathrm{emp}(x) - P_\alpha(x) |

其中P_\mathrm{emp}(x)P_\alpha(x)分別表示數據的cdfs和指數\alpha的冪律概率分佈。由於這種方法不以獨立同分佈數據為前提,所以它提供了一種替代方法來確定數據集的冪律指數,在這種情況下,時間相關性不能被忽略。[5]

兩點擬合法(Two-point fitting method)

兩點擬合法可用於無標度分佈情況下冪律指數的估計——它比極大似然估計更收斂[49] 。研究斷裂孔徑的概率分佈是這種方法的應用之一。某些情況下概率分佈並不使用積累分佈函數( cumulative distribution function)表述,而是根據滿足X> x條件的X的積累頻率 (cumulative frequency) ,其中X是每單位(或區域單位、秒等)的要素數目,x是一個可變實數。例如,[49]將N個元件的樣品的裂縫孔X的累積分佈定義為「每米的裂縫數目大於x的裂縫的數目」。使用累積頻率有其優勢,例如,它允許人們把從不同標度的不同長度的樣本線(例如分別從露頭(outcrop)和從顯微鏡)收集的相同的圖表數據放在一起。

R 函數

通過R函數估計指數, 並繪製雙對數數據擬合線:

    pwrdist <- function(u,...) {
        # u is vector of event counts, e.g. how many
        # crimes was a given perpetrator charged for by the police
        fx <- table(u)
        i <- as.numeric(names(fx))
        y <- rep(0,max(i))
        y[i] <- fx
        m0 <- glm(y~log(1:max(i)),family=quasipoisson())
        print(summary(m0))
        sub <-   
paste("s=",round(m0$coef[2],2),"lambda=",sum(u),"/",length(u))
        plot(i,fx,log="xy",xlab="x",sub=sub,ylab="counts",...)
        grid()
        lines(1:max(i),(fitted(m0)),type="b")
        return(m0)
    }

驗證冪律

儘管冪律關係因許多理論原因而具有吸引力,但證明數據確實遵循冪律關係需要的不僅僅是簡單地將特定模型擬合到數據中[21]。這對於理解產生分佈的機制很重要:表面上類似的分佈可能由於顯着不同的原因而出現,並且不同的模型產生不同的預測,例如外推法。


例如,對數正態分佈常被誤認為冪律分佈[50]:從對數正態分佈繪製的數據集對於大值(對應於對數正態的上尾接近冪律)將近似為線性,但對於較小的值,對數正態將顯着下降(向下彎曲),對應於對數正態的較低尾部較小(很少有小值,而不是冪律中的許多小值)。


例如,Gibrat關於比例增長過程的定律產生對數正態分佈,儘管它們的雙對數 圖在有限範圍內看起來是線性的。對此的解釋是,雖然對數正態密度函數的對數在log(x)中是二次的,但在雙對數圖中產生「弓形」形狀,如果二次項相對於線性項較小則結果可以看起來幾乎是線性的,並且對數正態行為僅在二次項佔優勢時才可見,這可能需要更多的數據。因此,向下略微「彎曲」的雙對數圖可以反映對數正態分佈——而不是冪律。


一般而言,許多替代函數形式在某種程度上似乎遵循冪律形式。[51] Stumpf[52]提出在雙對數域中繪製經驗累積分佈函數 ,並聲稱候選冪律至少應涵蓋兩個數量級。此外,研究人員通常不得不面對決定現實概率分佈是否遵循冪律的問題。作為解決這個問題的方法,Diaz [34] 提出了一種基於隨機樣本的圖形方法,允許在不同類型的尾部行為之間進行視覺辨別。該方法使用殘餘分位數函數的束,也稱為百分位剩餘壽命函數,其表徵許多不同類型的分佈尾部,包括重尾和非重尾。然而,Stumpf聲稱需要統計和理論背景,以支持驅動數據生成過程的基礎機制中的冪律。


驗證冪律關係的一種方法是對特定的生成機制對數據進行許多正交的預測。簡單地將冪律關係與特定類型的數據相匹配並不被認為是一種合理的方法。因此,在現代科學的許多領域中,對冪律的驗證仍然是一個非常活躍的研究領域。

代碼實現

參見

相關鏈接

參考文獻

引用文獻

  1. Bar-Yam, Yaneer (2015) "Concepts: Power Law".New England Complex Systems Institute. Retrieved 18 August.
  2. 2.0 2.1 Newman, M. E. J. (2005). "Power laws, Pareto distributions and Zipf's law". Contemporary Physics. 46 (5): 323–351. arXiv:cond-mat/0412004 Freely accessible. Bibcode:2005ConPh..46..323N. doi:10.1080/00107510500052444
  3. "Environmental context explains Lévy and Brownian movement patterns of marine predators". Nature 465 (7301): 1066–1069. 2010.
  4. 4.0 4.1 Klaus A, Yu S, Plenz D (2011). "Statistical Analyses Support Power Law Distributions Found in Neuronal Avalanches". PLoS ONE 6 (5): e19779.Bibcode:2010Natur.465.1066H.doi:10.1038/nature09116.PMID 20531470.
  5. 5.0 5.1 Albert, J. S.; Reis, R. E., eds. (2011). Historical Biogeography of Neotropical Freshwater Fishes. Berkeley: University of California Press.Bibcode:2016NatSR...622289C. doi:10.1038/srep22289. ISSN 2045-2322. PMC 4772095 Freely accessible.PMID 26926425.
  6. Cannavò, Flavio; Nunnari, Giuseppe (2016-03-01). "On a Possible Unified Scaling Law for Volcanic Eruption Durations" (in en). Scientific Reports 6. http://www.nature.com/articles/srep22289.
  7. Stevens, S. S. (1957). On the psychophysical law. Psychological Review, 64, 153-181
  8. Staddon, J. E. R. (1978). Theory of behavioral power functions. Psychological Review, 85, 305-320.
  9. 9.0 9.1 Clauset, A.; Shalizi, C. R.; Newman, M. E. J. (2009). "Power-Law Distributions in Empirical Data". SIAM Review. 51 (4): 661–703. arXiv:0706.1062 Freely accessible. Bibcode:2009SIAMR..51..661C. doi:10.1137/070710111
  10. Newman, M. E. J.; Reggiani, Aura; Nijkamp, Peter (2004). "Power laws, Pareto distributions and Zipf's law". Cities 30 (2005): 323–351.
  11. 11.0 11.1 9na CEPAL Charlas Sobre Sistemas Complejos Sociales (CCSSCS): Leyes de potencias
  12. Malcolm Gladwell (2006), Million-Dollar Murray; "Archived copy". Archived from the original on 2015-03-18. Retrieved 2015-06-14.
  13. Newman, Mark EJ. "Power laws, Pareto distributions and Zipf's law." Contemporary physics 46.5 (2005): 323-351.
  14. Sornette, Didier (2006). Critical Phenomena in Natural Sciences: Chaos, Fractals, Self-organization and Disorder: Concepts and Tools. Springer Series in Synergetics (2nd ed.). Heidelberg: Springer. ISBN 978-3-540-30882-9.
  15. Simon, H. A. (1955). "On a Class of Skew Distribution Functions". Biometrika. 42 (3/4): 425–440. doi:10.2307/2333389. JSTOR 2333389.
  16. Andriani, P.; McKelvey, B. (2007). "Beyond Gaussian averages: redirecting international business and management research toward extreme events and power laws". Journal of International Business Studies 38 (7): 1212–1230. https://link.springer.com/10.1057/palgrave.jibs.8400324.
  17. "Structural characteristics and radial properties of tropical cloud clusters". Monthly Weather Review 121: 3234–3260. 1993.
  18. Corral, A, Osso, A, Llebot, JE (2010). "Scaling of tropical cyclone dissipation". Nature Physics. 6: 693–696. arXiv:0910.0054 Freely accessible. Bibcode:2010NatPh...6..693C. doi:10.1038/nphys1725
  19. "Power Law of Dust Devil Diameters on Earth and Mars". Icarus 203: 683–684. 2009.
  20. Reed W.J.; Hughes B.D. From gene families and genera to incomes and internet file sizes: Why power laws are so common in nature. Phys Rev E 2002, 66, 067103; http://www.math.uvic.ca/faculty/reed/PhysRevPowerLawTwoCol.pdf
  21. 21.0 21.1 Hilbert, Martin (2013). "Scale-free power-laws as interaction between progress and diffusion". Complexity. 19: 56–65. Bibcode:2014Cmplx..19d..56H. doi:10.1002/cplx.21485.
  22. Bolmatov, D.; Brazhkin, V. V.; Trachenko, K. (2013). "Thermodynamic behaviour of supercritical matter". Nature Communications 4: 2331. https://www.nature.com/articles/ncomms3331.
  23. Etro, F.; Stepanova, E. (2018). "Power-laws in art". Physica A: Statistical Mechanics and its Applications. https://linkinghub.elsevier.com/retrieve/pii/S0378437118304813.
  24. Lewis Fry Richardson (1950). The Statistics of Deadly Quarrels.
  25. Albert, J. S., H. J. Bart, & R. E. Reis (2011). "Species richness & cladal diversity". In Albert, J. S., & R. E. Reis. Historical Biogeography of Neotropical Freshwater Fishes. Berkeley: University of California Press. pp. 89–104.
  26. Jóhannesson, Einar H. (2006) "Afterglow Light Curves and Broken Power Laws: A Statistical Study".The Astrophysical Journal, Retrieved.640, 07.(L5)
  27. Clauset, Aaron (2009). [https://en.wikipedia.org/wiki/Digital_object_identifier doi/10.1137/070710111 "POWER-LAW DISTRIBUTIONS IN EMPIRICAL DATA"]. SIAM Review 51: 661–703. https://epubs.siam.org/doi/10.1137/070710111.
  28. Curved-power law. http://www.mpe.mpg.de/xray/wave/rosat/doc/users-guide/node-files/node188.php. Retrieved 2013-07-07.
  29. N. H. Bingham, C. M. Goldie, and J. L. Teugels, Regular variation. Cambridge University Press, 1989
  30. Kendal, WS; Jørgensen, B (2011). "Taylor's power law and fluctuation scaling explained by a central-limit-like convergence". Phys. Rev. E 83: 066115. https://journals.aps.org/pre/abstract/10.1103/PhysRevE.83.066115.
  31. Kendal, WS; Jørgensen, BR (2011). "Tweedie convergence: a mathematical basis for Taylor's power law, 1/f noise and multifractality". Phys. Rev. E 84: 066120. https://journals.aps.org/pre/abstract/10.1103/PhysRevE.84.066120.
  32. Beirlant, J., Teugels, J. L., Vynckier, P. (1996a) Practical Analysis of Extreme Values, Leuven: Leuven University Press
  33. Coles, S. (2001) An introduction to statistical modeling of extreme values. Springer-Verlag, London.
  34. 34.0 34.1 34.2 Diaz, F. J. (1999). "Identifying Tail Behavior by Means of Residual Quantile Functions". Journal of Computational and Graphical Statistics 8 (3): 493–509.
  35. Resnick, S. I. (1997). "Heavy Tail Modeling and Teletraffic Data". The Annals of Statistics 25: 1805–1869.
  36. So You Think You Have a Power Law — Well Isn't That Special?. http://bactra.org/weblog/491.html. Retrieved 27 March 2018.
  37. Clauset, Aaron; Shalizi, Cosma Rohilla; Newman, M. E. J. (4 November 2009). "Power-law distributions in empirical data". SIAM Review 51 (4): 661–703. https://epubs.siam.org/doi/10.1137/070710111.
  38. Jeong, H; Tombor, B. Albert; Oltvai, Z.N.; Barabasi, A.-L. (2000). "The large-scale organization of metabolic networks". Nature 407 (6804): 651–654. https://www.nature.com/articles/35036627.
  39. Arnold, B. C.; Brockett, P. L. (1983). "When does the βth percentile residual life function determine the distribution?". Operations Research 31 (2): 391–396. https://pubsonline.informs.org/doi/abs/10.1287/opre.31.2.391.
  40. Joe, H.; Proschan, F. (1984). "Percentile residual life functions". Operations Research 32 (3): 668–678. https://pubsonline.informs.org/doi/abs/10.1287/opre.32.3.668.
  41. Joe, H. (1985), "Characterizations of life distributions from percentile residual lifetimes", Ann. Inst. Statist. Math. 37, Part A, 165–172.
  42. Csorgo, S.; Viharos, L. (1992). "Confidence bands for percentile residual lifetimes". Journal of Statistical Planning and Inference 30: 327–337. https://linkinghub.elsevier.com/retrieve/pii/037837589290159P.
  43. Schmittlein, D. C.; Morrison, D. G. (1981). "The median residual lifetime: A characterization theorem and an application". Operations Research 29 (2): 392–399. https://en.wikipedia.org/wiki/Digital_object_identifier.
  44. Morrison, D. G.; Schmittlein, D. C. (1980). "Jobs, strikes, and wars: Probability models for duration". Organizational Behavior and Human Performance 25: 224–251. https://linkinghub.elsevier.com/retrieve/pii/0030507380900653.
  45. Gerchak, Y (1984). "Decreasing failure rates and related issues in the social sciences". Operations Research 32 (3): 537–546. https://pubsonline.informs.org/doi/abs/10.1287/opre.32.3.537.
  46. Bauke, H.. "Parameter estimation for power-law distributions by maximum likelihood methods". The European Physical Journal 58 (2): 167–173. https://link.springer.com/article/10.1140/epjb/e2007-00219-y.
  47. Clauset, A., Shalizi, C. R., Newman, M. E. J.. [https://en.wikipedia.org/wiki/Digital_object_identifier doi/pdf/10.1137/070710111 "Power-Law Distributions in Empirical Data"]. SIAM Review 51 (4): 661–703. https://epubs.siam.org/doi/pdf/10.1137/070710111.
  48. Hall, P. (1982). "On Some Simple Estimates of an Exponent of Regular Variation". Journal of the Royal Statistical Society, Series B. 44 (1): 37–42. JSTOR 2984706
  49. 49.0 49.1 Guerriero, V. (2012). "Power Law Distribution: Method of Multi-scale Inferential Statistics". Journal of Modern Mathematics Frontier (JMMF) 1: 21–28. http://www.seipub.org/sjmmf/paperInfo.aspx?ID=5093.
  50. Mitzenmacher, M. (2004). "A Brief History of Generative Models for Power Law and Lognormal Distributions" (PDF). Internet Mathematics. 1 (2): 226–251. doi:10.1080/15427951.2004.10129088.
  51. Laherrère, J.; Sornette, D. (1998). "Stretched exponential distributions in nature and economy: "fat tails" with characteristic scales". The European Physical Journal B. 2 (4): 525–539. arXiv:cond-mat/9801293 Freely accessible. Bibcode:1998EPJB....2..525L. doi:10.1007/s100510050276
  52. Stumpf, M.P.H. (2012). "Critical Truths about Power Laws". Science. 335: 665–666. Bibcode:2012Sci...335..665S. doi:10.1126/science.1216142.

參考書目

  • Sornette, Didier (2006). Critical Phenomena in Natural Sciences: Chaos, Fractals, Self-organization and Disorder: Concepts and Tools. Springer Series in Synergetics (2nd ed.). Heidelberg: Springer. ISBN 978-3-540-30882-9.
  • Mark Buchanan (2000) Ubiquity, Weidenfeld & NicolsonISBN 0-297-64376-2

相關wiki

本詞條內容翻譯自 wikipedia.org,遵守 CC3.0協議。

個人工具
名字空間
動作
導覽
工具箱