轉載自:AI開發者
本文1373字,建議閱讀4分鐘。
本文介紹最常見的基本機率分布教程,大多數和使用 python 庫進行深度學習有關。
機率分布概述
- 共軛意味著它有共軛分布的關係。
在貝葉斯機率論中,如果後驗分布 p(θx)與先驗機率分布 p(θ)在同一機率分布族中,則先驗和後驗稱為共軛分布,先驗稱為似然函數的共軛先驗。共軛先驗維基百科在這裡(https://en.wikipedia.org/wiki/Conjugate_prior)。
- 多分類表示隨機方差大於 2。
- n 次意味著我們也考慮了先驗機率 p(x)。
- 為了進一步了解機率,我建議閱讀 [pattern recognition and machine learning,Bishop 2006]。
分布機率與特徵
1.均勻分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py
均勻分布在 [a,b] 上具有相同的機率值,是簡單機率分布。
2.伯努利分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py
- 先驗機率 p(x)不考慮伯努利分布。因此,如果我們對最大似然進行優化,那麼我們很容易被過度擬合。
- 利用二元交叉熵對二項分類進行分類。它的形式與伯努利分布的負對數相同。
3.二項分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/binomial.py
- 參數為 n 和 p 的二項分布是一系列 n 個獨立實驗中成功次數的離散機率分布。
- 二項式分布是指通過指定要提前挑選的數量而考慮先驗機率的分布。
4.多伯努利分布,分類分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py
- 多伯努利稱為分類分布。
- 交叉熵和採取負對數的多伯努利分布具有相同的形式。
5.多項式分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py
多項式分布與分類分布的關係與伯努爾分布與二項分布的關係相同。
6.β分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py
- β分布與二項分布和伯努利分布共軛。
- 利用共軛,利用已知的先驗分布可以更容易地得到後驗分布。
- 當β分布滿足特殊情況(α=1,β=1)時,均勻分布是相同的。
7.Dirichlet 分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py
- dirichlet 分布與多項式分布是共軛的。
- 如果 k=2,則為β分布。
8.伽馬分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py
- 如果 gamma(a,1)/gamma(a,1)+gamma(b,1)與 beta(a,b)相同,則 gamma 分布為β分布。
- 指數分布和卡方分布是伽馬分布的特例。
9.指數分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py
指數分布是 α 為 1 時 γ 分布的特例。
10.高斯分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py
高斯分布是一種非常常見的連續機率分布。
11.正態分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py
正態分布為標準高斯分布,平均值為 0,標準差為 1。
12.卡方分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py
- k 自由度的卡方分布是 k 個獨立標準正態隨機變量的平方和的分布。
- 卡方分布是 β 分布的特例
13.t 分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py
t 分布是對稱的鐘形分布,與正態分布類似,但尾部較重,這意味著它更容易產生遠低於平均值的值。
via:https://github.com/graykode/distribution-is-all-you-need
—完—
關注清華-青島數據科學研究院官方微信公眾平台「 THU數據派 」及姊妹號「 數據派THU 」獲取更多講座福利及優質內容。