數學中,單峰意味着擁有唯一的眾數。更一般地說,單峰意味着數學物件只有唯一的最大值。[1]

單峰概率分佈 編輯

 
圖 1. 正態分佈的概率密度函數,單峰分佈的例子。
 
圖 2. 簡單雙峰分佈。
 
圖 3. 雙峰分佈。注意只有最大的峰才對應嚴格的峰定義。

統計學中,單峰概率分佈單峰分佈是具有單一峰值的概率分佈。「峰」指分佈的任何峰值,不僅僅是統計學中通常的眾數

若只有一個峰,則分佈函數就是「單峰」的。除此之外都叫做「多峰」(multimodal)。[2]圖 1展示的正態分佈柯西分佈T分佈卡方分佈指數分佈等都是單峰分佈。離散型分佈中,二項分佈泊松分佈可視作單峰分佈,但對於某些參數可以在兩個相鄰值上產生相同的概率。

圖 2、圖 3展示了雙峰分佈。

其他定義 編輯

分佈函數的單峰性還有其他定義。

對於連續型分佈,單峰性可通過累積分佈函數(CDF)的行為定義。[3]若CDF在 時是的、在 時是的,則分佈就是單峰分佈, 為眾數。需要注意的是,根據這一定義,均勻分佈也是單峰分佈[4],任何在一定區間內可取到最大分佈的也是單峰分佈,如梯形分佈。這一定義通常允許峰處不連續;在連續分佈中,任意單一值的概率通常都是0,而這一定義則允許在峰中存在非零概率點。

單峰的標準也可用分佈的特徵函數[3]拉普拉斯-斯蒂爾切斯轉換來定義。[5]

定義單峰離散分佈的另一種方法是通過概率差序列的變號。[6]離散分佈的概率質量函數 ,若序列 只有一次變號(不計入零),則稱為單峰分佈。

使用與結果 編輯

分佈的單峰性之所以重要,是因為它可以得到幾個重要的結果。下面給出的幾個不等式僅適用於單峰分佈,因此評估給定數據集是否來自單峰分佈非常重要。雙峰分佈條目中給出了幾種單峰測試法。

不等式 編輯

高斯不等式 編輯

高斯不等式是第一個重要結果,[7]給出了值與峰的距離超過給定數的概率的上限,其只能用於單峰分佈。

維索尚斯基–佩圖寧不等式 編輯

第二個是維索尚斯基–佩圖寧不等式[8]其是柴比雪夫不等式的細化。柴比雪夫不等式保證在任何分佈中,「幾乎所有」值都「接近」均值。而維索尚斯基–佩圖寧不等式則將其細化到更接近的值,前提是分佈函數為連續單峰的。Sellke與Sellke得出了進一步的結果。[9]

眾數、中位數與平均數 編輯

高斯在1823年也證明了單峰分佈的情形[10]

 

 

其中中位數ν,平均數是μω是與眾數的均方根誤差

對於單峰分佈,可以證明中位數ν與平均值μ在(3/5)1/2 ≈ 0.7746個標準差的範圍內。[11]用符號表示,

 

其中| . |是絕對值

2020年,Bernard、Kazzi與Vanduffel通過推導對稱分位數均值 與均值[12]

 

之間的最大距離,推廣了前面的不等式。值得注意的是, 時最大距離取得最小(即當對稱分位均值 ),這也是選擇中位數為均值的穩健估計值的原因之一。此外,當 ,邊界等於 ,這時單峰分佈中位數和均值距離的最大值。

中位數和眾數θ也有類似關係:它們位於31/2 ≈ 1.732個標準差之內:

 

也可以證明均值和眾數相差在31/2之內:

 

偏度與峰度 編輯

Rohatgi與Szekely聲稱,單峰分佈的偏度峰度可通過不等式相聯繫:[13]

 

κ為峰度,γ為偏度。Klaassen、Mokveld與van Es發現,這隻適於部分情形,如眾數與均值重合的單峰分佈集合。[14]

他們推導出了一個適用於所有單峰分佈的較弱不等式:[14]

 

這個界限很銳,因為它是[0, 1]上的均勻分佈和{0}處的離散分佈的等權混合。

單峰函數 編輯

「峰」適用於數據集合概率分佈,而非一般函數,所以上述定義並不適用。「單峰」的定義可擴展到實數函數。

通常定義如下:若對某值m,函數f(x)在 單調遞增、在 時單調遞減,則為單峰函數。也就是說,f(x)的最大值f(m),且沒有其他極大值。

證明單峰性通常很難。一種方法是利用定義,但這隻適用於簡單函數。還有基於導數的通用方法[15],但並不適用於每個函數。

單峰函數有二次項系數為負的二次函數帳篷映射等等。

上述情形有時被稱為強單調性。如有值m使 時,函數f(x)弱單調遞增; 時,函數f(x)弱單調遞減,則稱函數為弱單峰函數。這時,x存在可取到最大值f(m)的區間。楊輝三角的每一行都是弱單峰函數。

單峰函數也可以指只有一個極小值的函數。[16]例如,數值最佳化中的局部單峰抽樣經常用這樣的函數演示。可以說,這種推廣下的單峰函數具有單一局部極值。

單峰函數的重要特性之一是,可以使用黃金分割搜索三份查找逐次拋物線插值搜索算法找到最值。[17]

其他推廣 編輯

 施瓦次導數均為負,則函數f(x)是「S-單峰」(常稱為「S-單峰映射」)函數,其中 是臨界點。[18] 計算幾何中,單峰函數可以設計出高效的找到極值的算法。[19]

適用於向量自變量X的函數f(X)的更一般定義是,若存在可微單射X = G(Z)使f(G(Z))為凸函數,則f是單峰函數。通常,我們希望G(Z)連續可微,且有可逆雅各布矩陣。

擬凸函數和擬凹函數將單峰性推廣到參數屬於高維歐幾里得空間的函數。

另見 編輯

參考文獻 編輯

  1. ^ 埃里克·韋斯坦因. Unimodal. MathWorld. 
  2. ^ 埃里克·韋斯坦因. Mode. MathWorld. 
  3. ^ 3.0 3.1 A.Ya. Khinchin. On unimodal distributions. Trams. Res. Inst. Math. Mech. (University of Tomsk). 1938, 2 (2): 1–7 (俄語). 
  4. ^ Ushakov, N.G., Unimodal distribution, Hazewinkel, Michiel (編), 数学百科全书, Springer, 2001, ISBN 978-1-55608-010-4 
  5. ^ Vladimirovich Gnedenko and Victor Yu Korolev. Random summation: limit theorems and applications. CRC-Press. 1996. ISBN 0-8493-2875-6.  p. 31
  6. ^ Medgyessy, P. On the unimodality of discrete distributions. Periodica Mathematica Hungarica. 1972-03, 2 (1–4): 245–257. S2CID 119817256. doi:10.1007/bf02018665. 
  7. ^ Gauss, C. F. Theoria Combinationis Observationum Erroribus Minimis Obnoxiae, Pars Prior. Commentationes Societatis Regiae Scientiarum Gottingensis Recentiores. 1823, 5. 
  8. ^ D. F. Vysochanskij, Y. I. Petunin. Justification of the 3σ rule for unimodal distributions. Theory of Probability and Mathematical Statistics. 1980, 21: 25–36. 
  9. ^ Sellke, T.M.; Sellke, S.H. Chebyshev inequalities for unimodal distributions. American Statistician (American Statistical Association). 1997, 51 (1): 34–40. JSTOR 2684690. doi:10.2307/2684690. 
  10. ^ Gauss C.F. Theoria Combinationis Observationum Erroribus Minimis Obnoxiae. Pars Prior. Pars Posterior. Supplementum. Theory of the Combination of Observations Least Subject to Errors. Part One. Part Two. Supplement. 1995. Translated by G.W. Stewart. Classics in Applied Mathematics Series, Society for Industrial and Applied Mathematics, Philadelphia
  11. ^ Basu, S.; Dasgupta, A. The Mean, Median, and Mode of Unimodal Distributions: A Characterization. Theory of Probability & Its Applications. 1997, 41 (2): 210–223 [2023-09-24]. doi:10.1137/S0040585X97975447. (原始內容存檔於2019-04-29). 
  12. ^ Bernard, Carole; Kazzi, Rodrigue; Vanduffel, Steven. Range Value-at-Risk bounds for unimodal distributions under partial information. Insurance: Mathematics and Economics. 2020, 94: 9–24. doi:10.1016/j.insmatheco.2020.05.013 . 
  13. ^ Rohatgi, Vijay K.; Székely, Gábor J. Sharp inequalities between skewness and kurtosis. Statistics & Probability Letters. 1989, 8 (4): 297–299. doi:10.1016/0167-7152(89)90035-7. 
  14. ^ 14.0 14.1 Klaassen, Chris A.J.; Mokveld, Philip J.; Van Es, Bert. Squared skewness minus kurtosis bounded by 186/125 for unimodal distributions. Statistics & Probability Letters. 2000, 50 (2): 131–135. doi:10.1016/S0167-7152(00)00090-0. 
  15. ^ On the unimodality of METRIC Approximation subject to normally distributed demands. (PDF). Method in appendix D, Example in theorem 2 page 5. [2013-08-28]. (原始內容存檔 (PDF)於2017-08-09). 
  16. ^ Mathematical Programming Glossary.. [2020-03-29]. (原始內容存檔於2022-03-28). 
  17. ^ Demaine, Erik D.; Langerman, Stefan. Optimizing a 2D Function Satisfying Unimodality Properties. Brodal, Gerth Stølting; Leonardi, Stefano (編). Algorithms – ESA 2005. Lecture Notes in Computer Science 3669. Berlin, Heidelberg: Springer. 2005: 887–898 [2023-09-24]. ISBN 978-3-540-31951-1. doi:10.1007/11561071_78. (原始內容存檔於2023-07-09) (英語). 
  18. ^ See e.g. John Guckenheimer; Stewart Johnson. Distortion of S-Unimodal Maps. Annals of Mathematics. Second Series. July 1990, 132 (1): 71–130. JSTOR 1971501. doi:10.2307/1971501. 
  19. ^ Godfried T. Toussaint. Complexity, convexity, and unimodality. International Journal of Computer and Information Sciences. June 1984, 13 (3): 197–217. S2CID 11577312. doi:10.1007/bf00979872.