Common Distributions

1 离散型随机变量的分布

1.1 (01)分布

Definition 1.1 设随机变量X只可能取01两个值,它的分布律是 P(X=k)=pkq1k,k=0,1;p+q=1(0<p<1) 则称X服从(01)分布两点分布,记为XB(x,p)
其中E(X)=pD(X)=p(1p)

1.2 二项分布

Definition 1.2 n次独立重复试验中,记X为事件A发生的次数,假设在每次试验中事件A发生的概率都是p,则随机变量X的分布称为二项分布,记为 XBinom(n,p),其概率函数为 P(X=k|n,p)=(nk)(1p)nk,(k=0,1,,n;0<p<1) 其中E(X)=np, D(X)=np(1p)

1.3 几何分布

Definition 1.3 n次伯努利试验中,试验k次才得到第一次成功的机率,即前k1次皆失败,第k次成功的概率。其概率函数为 f(x)=P(X=x)=p(1p)x1,(x=1,2,) 则称X的分布为几何分布,记为Xgeom(p)

其数学期望和方差分别为 E(X)=1p,D(X)=1pp2.

1.4 负二项分布

Definition 1.4 假设有一组独立的伯努利实验,每次实验都有两种结果“成功”和“失败”,X为实验成功r次之前失败的次数,实验持续到r次成功,r为正整数,其概率函数为 f(x)=(r+x1x)pr(1p)x,(x=0,1,2,) 则称X的分布为负二项分布,记为XNB(r,p)。当r=1时,NB(1,p)=Geom(p)

其数学期望和方差为 E(X)=r(1p)p,D(X)=r(1p)p2.

1.5 超几何分布

Definition 1.5 产品抽样检查中经常遇到一类实际问题,假定在N件产品中有M件不合格品,即不合格率p=M/N。在产品中随机抽n件做检查,发现k件不合格品的概率为 PX=k=(Mk)(NMnk)(Nk),kZ,max{0,nN+M}kmin{n,M} 则称X的分布为超几何分布,记为XH(N,M,n)

其数学期望和方差为 E(X)=nMN,D(X)=nMN(1MN)(NnN1).

1.6 泊松分布

Definition 1.6 设随机变量X所有可能取的值为0,1,2,,参数λ是单位时间[0,1]内随机事件的平均发生次数,其概率函数为 P(X=x)=λxeλx!,(x=0,1,2,) 则称X服从参数为λ泊松分布,记为XPosi(λ)
其中E(X)=λD(X)=λ

2 连续型随机变量的分布

2.1 均匀分布

Definition 2.1 如果随机变量X的密度函数(pdf)为 Xf(x|a,b)={1ba,a<x<b0,otherwiseX的分布称为(a,b)区间的均匀分布,记为 XUnif(a,b)

其数学期望和方差分别为 E(X)=a+b2,D(X)=(ba)212.

2.2 正态分布

Definition 2.2 若连续型随机变量x的概率密度(pdf)f(x)=12πσexp((xμ)22σ2) 其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ正态分布,记为XN(μ,σ2)
其中E(X)=μD(X)=σ2
μ=0,σ=1时,正态分布就成了标准正态分布,记为XN(0,1)

f(x)=12πexp(x22)

2.3 指数分布

Definition 2.3 设连续型随机变量x的概率密度(pdf)f(x)={λeλx,x>00,x0 其中λ>0为常数,则称为X服从参数λ指数分布,记为XExp(λ)

其数学期望和方差分别为 E(X)=1λ,D(X)=1λ2. \end{eqnarray*}

2.4 伽马(Γ)分布

Definition 2.4 假设随机变量x为等到第α件事发生所需的等候时间,概率密度函数(pdf)f(x)=λαΓ(α)xα1eλx,(x>0) 则称X的分布称为伽马分布,分布中的参数α为形状参数,λ为尺度参数,记为XΓ(α,λ)Xgamma(α,λ)

其数学期望和方差分别为 E(X)=αλ,D(X)=αλ2.

2.5 逆伽玛分布

Definition 2.5 如果1/XGamma(α,β),则称X服从逆伽玛分布,记为 XIG(α,β) 分布,其pdf为: f(x|α,β)=βαΓ(α)x(α+1)exp(β/x),(α>0,β>0)

其数学期望为 E(X)=β/(α1),α>1,

其方差为 D(X)=α2(α1)2(α2), α>2.

If XIG(α,β), then 1/XGamma(α,β)

If XIG(ν/2,νs2/2), then νs2/Xχ2(ν)

2.6 贝塔(β)分布

Definition 2.6 一组定义在(0,1)区间的连续概率分布,有两个参数α,β>0,其概率密度函数(pdf)f(x)=1B(α,β)xα1(1x)β1=Γ(α+β)Γ(α)Γ(β)xα1(1x)β1,(0<x<1) 随机变量X服从参数为α,β贝塔分布,记为 XBeta(α,β)

其数学期望和方差分别为 E(X)=αα+β,D(X)=αβ(α+β)2(α+β+1).

2.7 柯西分布

Definition 2.7 柯西分布是一个数学期望不存在的连续型概率分布,其概率密度函数(pdf)f(x)=1βπ[1+(xmβ)2]1=1π1λ2+(xa)2,(<x<) 式中m为定义峰值位置的位置参数,β为尺度参数,记为Xcauchy(location=m,scale=β)

其数学期望和方差不存在。

2.8 对数正态分布

Definition 2.8 一个随机变量的对数服从正态分布,则该随机变量服从对数正态分布,设X是取值为正数的连续随机变量,若lnXN(μ,σ2)X的概率密度函数(pdf)为 f(x)=1xσ2πexp[(lnxμ)22σ2],(x>0) 记为XInorm(μ,σ2)

其数学期望和方差分别为 E(X)=eμ+σ22,D(X)=(eσ21)e2μ+σ2.

2.9 韦布尔分布/韦伯分布

Definition 2.9 韦伯分布是一个连续型的概率分布,是可靠性分析和寿命检验的理论基础,其概率密度函数(pdf)为 f(x)=αβ(xβ)α1exp(xβ)α,(x>0) 其中,α为比例参数,β是形状参数,记为 XWeibull(α,β)

其数学期望和方差分别为 E(X)=αΓ(1+1β),D(X)=α2[Γ(1+2β)Γ(1+1β)2].

2.10 t分布

Definition 2.10 XN(0,1),Yχ2(n)。 且X,Y独立,则称随机变量t=XY/n服从自由度为nt分布,记为tt(n)t分布又称学生氏分布t(n)分布的概率密度函数(pdf)为 h(t)=Γ[(n+1)/2]πnΓ(n+2)(1+t2n)(n+1)/2,(<x<)

其数学期望和方差分别为E(X)=0,D(X)=nn2

2.11 一般t分布

Definition 2.11 一个随机变量称为 Ttν(μ,σ2), 如果 T=μ+σZ,其中 Z 为标准 t- 分布,其pdf为 f(t|ν,μ,σ2)=Γ[(ν+1)/2](σ2νπ)1/2Γ(ν/2)[1+(tμ)2νσ2](ν+1)/2 其中ν为自由度,μ为位置参数,σ为尺度参数。

其均值为 E(T)=μ(ν>1),其方差为 Var(T)=νσ2ν2 (ν>2).

如果μ=0,σ2=1,则为标准t-分布:Tt(ν)

2.12 多元t分布

Definition 2.12 p维随机向量ytν(μ,Σ)t(μ,Σ,ν),如果 f(y)=c|Σ|12(1+1ν(yμ)TΣ1(yμ))(ν+p)/2 其中ν自由度,μ 为位置参数,Σ为尺度参数(正定矩阵)。

如果ν=1,则为哥西(Cauchy)分布。

其数学期望为E(Y)=μ,(ν>1),其方差为 D(Y)=νν2Σ,(ν>2).

2.13 卡方(χ2)分布

Definition 2.13 X1,X2,,Xn是来自总体N(0,1)的样本,则称统计量χ2=X12+X22++Xn2服从自由度为n卡方分布,记为χ2χ2(n)。自由度是指包含独立变量的个数。其概率密度函数(pdf)f(y)={12n/2Γ(n/2)yn/21ey/2,y>00,otherwise

其数学期望和方差分别为E(χ2)=n,D(χ2)=2n

2.14 F分布

Definition 2.14 Uχ2(n1),Vχ2(n2)。 且U,V独立,则称随机变量F=U/n1V/n2服从自由度为(n1,n2)F分布,记为FF(n1,n2),其概率密度为 f(y)={Γ[(n1+n2)/2](n1/n2)n1/2y(n1/2)1Γ(n1/2)Γ(n2/2)[1+(n1y/n2)](n1+n2)/2y>00,otherwise

其数学期望和方差分别为 E(X)=n2n22,D(X)=2n22(n1+n22)n1(n22)2(n24),(n2>4).

2.15 拉普拉斯分布

Definition 2.15 如果随机变量X的密度函数(pdf)为 f(x)=12λexp(|xμ|λ) 其中λ,μ为常数,且λ>0,则称X服从参数为μ(位置参数),λ(尺度参数)的拉普拉斯分布,记为XLa(μ,λ)
其数学期望和方差分别为E(X)=μ,D(X)=2λ2.

2.16 瑞利分布

Definition 2.16 如果随机变量X的密度函数(pdf)为 Xf(x)={xσ2expx2(2σ2),x>00,otherwiseX的分布称为瑞利分布

其数学期望和方差分别为 E(X)=π2σ,D(X)=4π2σ2.

3 常用多维分布

3.1 多项分布

Definition 3.1 假设进行n次独立重复试验,每次试验中有k个可能的结果,各个结果发生的概率分别为 p1,...,pk (其中pi0,i=1kpi=1)。记 Xi 为第i个结果出现的次数,则称随机向量X=(X1,X2,,Xk)T 服从多项分布(Multinomial distribution),参数为 np=(p1,p2,,pk)T,记为XMultinom(n,p),其联合概率函数(pmf)为 P(X1=x1,,Xk=xk)=(nx1xxxk) p1x1p2x2pkxk,(xi0,i=1kxi=n).

多项分布Multinom(n,p)具有如下性质:

  1. E(X)=np, 即 E(Xi)=npi(i=1,2,,k)

  2. X的协方差矩阵Σ 是对称矩阵,其对角线元素为 σi2=npi(1pi), 非对角线元素为 Cov(Xi,Xj)=npipj(ij).

  3. X的相关系数矩阵元素为 Corr(Xi,Xj)=npipjnpi(1pi)npj(1pj)=pipjqiqj

  4. X(k1)=(X1,X2,,Xk1)T,则 X(k1)Multinom(n,p(k1)),其中 p(k1)=(p1,,pk2,pk1+pk)T.

特别, XiBin(n,pi).

3.2 多元正态分布

Definition 3.2 多元正态分布亦称为多变量高斯分布。它是一元正态分布向多维的推广。
N维随机向量X=[X1,,XN]T如果服从多元正态分布,必须满足下面的三个等价条件:

(1)任何线性组合Y=a1X1++aNXN服从正态分布。

(2)存在随机向量Z=[Z1,,ZM]T(它的每个元素服从独立标准正态分布), 向量μ=[μ1,,μN]TN×M矩阵A满足X=AZ+μ

(3)存在μ和一个对称半正定阵Σ满足X的特征函数: φX(μ;μ,Σ)=exp(iμTμ12μTΣμ)
如果一个p维随机向量X服从多元正态分布(多元高斯分布),其联合概率密度函数为 f(x)=1(2π)p/2|Σ|1/2exp{12(xμ)TΣ1(xμ)},(Σ>0) 其中μ是均值向量,Σ是对称正半定矩阵,记为XNp(μ,Σ)

其数学期望和方差分别为
E(X)=μ,D(X)=Σ.

3.3 威希特分布(Wishart分布)

Definition 3.3 假设X(α)(α=1,2,...,n)相互独立,且X(α)Np(0,Σ),则随机p×p矩阵 W=i=1pxixiT 服从自由度为n威希特分布,记为WWp(n,Σ)。其概率密度函数为 f(W)=12np2|Σ|n2Γp(n2)|W|np12exp{12tr(Σ1W)}

其数学期望和方差分别为
E(W)=nΣ, D(wij)=n(σij2+σiiσjj) 对于np的矩阵W,如果Σ是可逆的,那么它也是可逆的。当p=Σ=1,那么这个分布是一个自由度为nχ2分布。

3.4 T2分布(Hotelling T2 分布)

Definition 3.4 假设WWp(n,Σ)XNp(0,Σ)npΣ>0, WX相互独立,则随机变量 T2=nXTW1X 所遵从的分布为第一自由度为p,第二自由度为nT2分布,记为T2T2(p,n)T2分布可转化为F分布,其关系可以表示为: np+1pnT2(p,n)=F(p,np+1)

3.5 Wilks分布

Definition 3.5 假设W1Wp(n1,Σ), W2Wp(n2,Σ), Σ>0, n1>p,W1W2相互独立, 则 Λ=W1W1+W2 服从维度为p, 第一自由度为n1, 第二自由度为n2WilksΛ分布, 记为ΛΛ(p,n1,n2)
Avatar
Fei Wang
Student,Senior

My research interests include biomedical igmaging, neuroengineering.

Previous