深度學習必懂的13種機率分布

thu數據派 發佈 2020-01-24T20:37:12+00:00

本文介紹最常見的基本機率分布教程,大多數和使用python 庫進行深度學習有關。9.指數分布代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py 指數分布是 α

轉載自:AI開發者

本文1373字,建議閱讀4分鐘

本文介紹最常見的基本機率分布教程,大多數和使用 python 庫進行深度學習有關。

機率分布概述

  • 共軛意味著它有共軛分布的關係。

在貝葉斯機率論中,如果後驗分布 p(θx)與先驗機率分布 p(θ)在同一機率分布族中,則先驗和後驗稱為共軛分布,先驗稱為似然函數的共軛先驗。共軛先驗維基百科在這裡(https://en.wikipedia.org/wiki/Conjugate_prior)。

  • 多分類表示隨機方差大於 2。
  • n 次意味著我們也考慮了先驗機率 p(x)。
  • 為了進一步了解機率,我建議閱讀 [pattern recognition and machine learning,Bishop 2006]。


分布機率與特徵

1.均勻分布(連續)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py

均勻分布在 [a,b] 上具有相同的機率值,是簡單機率分布。

2.伯努利分布(離散)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py

  • 先驗機率 p(x)不考慮伯努利分布。因此,如果我們對最大似然進行優化,那麼我們很容易被過度擬合。
  • 利用二元交叉熵對二項分類進行分類。它的形式與伯努利分布的負對數相同。

3.二項分布(離散)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/binomial.py

  • 參數為 n 和 p 的二項分布是一系列 n 個獨立實驗中成功次數的離散機率分布。
  • 二項式分布是指通過指定要提前挑選的數量而考慮先驗機率的分布。

4.多伯努利分布,分類分布(離散)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py

  • 多伯努利稱為分類分布。
  • 交叉熵和採取負對數的多伯努利分布具有相同的形式。

5.多項式分布(離散)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py

多項式分布與分類分布的關係與伯努爾分布與二項分布的關係相同。

6.β分布(連續)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py

  • β分布與二項分布和伯努利分布共軛。
  • 利用共軛,利用已知的先驗分布可以更容易地得到後驗分布。
  • 當β分布滿足特殊情況(α=1,β=1)時,均勻分布是相同的。

7.Dirichlet 分布(連續)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py

  • dirichlet 分布與多項式分布是共軛的。
  • 如果 k=2,則為β分布。

8.伽馬分布(連續)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py

  • 如果 gamma(a,1)/gamma(a,1)+gamma(b,1)與 beta(a,b)相同,則 gamma 分布為β分布。
  • 指數分布和卡方分布是伽馬分布的特例。

9.指數分布(連續)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py

指數分布是 α 為 1 時 γ 分布的特例。

10.高斯分布(連續)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py

高斯分布是一種非常常見的連續機率分布。

11.正態分布(連續)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py

正態分布為標準高斯分布,平均值為 0,標準差為 1。

12.卡方分布(連續)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py

  • k 自由度的卡方分布是 k 個獨立標準正態隨機變量的平方和的分布。
  • 卡方分布是 β 分布的特例

13.t 分布(連續)

代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py

t 分布是對稱的鐘形分布,與正態分布類似,但尾部較重,這意味著它更容易產生遠低於平均值的值。

via:https://github.com/graykode/distribution-is-all-you-need

—完—

關注清華-青島數據科學研究院官方微信公眾平台「 THU數據派 」及姊妹號「 數據派THU 」獲取更多講座福利及優質內容。

關鍵字: