定义 对随机现象进行观察或实验称为随机试验,简称试验,记作E。它具有如下特点:
- 可以在相同条件下重复进行
- 所得到可能结果不止一个,且所有可能结果都能事前已知
- 每次具体实验之前无法预知会出现哪个结果
例如,抛一枚硬币,记录其结果是正面向上还是反面向上
定义 随机试验的每一可能结果称为样本点,记作ω。由所有样本点全体组成的集合称为样本空间,记作Ω
注:显然,样本点是组成样本空间的元素
定义 样本空间的子集称为随机事件,简称事件,常用字母A,B,C等表示
随机事件是由样本空间中的元素即样本点组成,由一个样本点组成的子集是最简单事件,称为基本事件。随机事件既然由样本点组成,因此,也可能将随机事件看成是由基本事件组成
如果一次试验的结果为某一基本事件出现,就称该基本事件出现或发生。如果组成事件A的一个基本事件出现或发生,也称事件A出现或发生
把Ω看成一事件,则每次试验必有Ω中某一基本事件(即样本点)发生,也就是每次试验Ω必然发生,称Ω为必然事件
把不包含任何样本点的空集∅看成一个时间,每次试验∅必不发生,称∅为不可能事件
定义 如果事件A发生必然导致事件B发生,则称事件B包含事件A,或称事件A包含于事件B,记为B⊃A或A⊂B
定义 如果A⊃B与B⊃A同时成立,则称事件A与事件B相等,记作A=B
注:A=B表示事件A与事件B有完全相同的样本点
定义 如果事件A与事件B同时发生,则称这样的一个事件为事件A与事件B的交或积,记为A∩B或AB
集合A∩B是由同时属于A与B的所有公共样本点构成
事件的交可以推广到有限多个事件或可数无穷多个事件的情形:
∩i=1nAi=A1∩A2⋯∩An,∩i=1+∞Ai=A1∩A2∩⋯∩An∩⋯
定义 如果事件A与事件B的关系为AB=∅,即A与B不能同时发生,则称事件A和事件B为互斥或互不相容
互斥的两事件没有公共样本点
事件的互斥可以推广到有限多个事件或可数无穷多个事件的情形
若n个事件A1,A2,⋯,An中任意两个事件均互斥,即AiAj=∅,i=j,i,j=1,2,⋯,n,则称这n个事件是两两互斥或两两互不相容
如果可数无穷个事件A1,A2,⋯,An,⋯中任意两个事件均互斥,即AiAj=∅,i=j,i,j=1,2,⋯,n,⋯,则称这可数无穷个事件是两两互斥或两两互不相容
定义 如果事件A与事件B至少有一个发生,则称这样一个事件为事件A与事件B的并或和,记为A∪B
集A∪B是由属于A与B的所有样本点构成
事件的并可推广到有限多个事件或可数无穷多个事件的情形:
∪i=1nAi=A1∪A2∪⋯∪An,∪i=1+∞Ai=A1∪A2∪⋯∪An∪⋯
定义 如果事件A与事件B有且仅有一个发生,即同时成立A∪B=Ω,且A∩B=∅,则称事件A与事件B为对立事件或互逆事件,记为Aˉ=B或Bˉ=A
注:在样本空间中,集合Aˉ是由所有不属于事件A的样本点构成的集合
定义 事件A发生而事件B不发生称为事件A与事件B的差,记为A−B
在样本空间中集合A−B是由属于事件A而不属于事件B的所有样本点构成的集合,显然A−B=ABˉ
- 交换律 A∪B=B∪A,A∩B=B∩A
- 结合律 A∪(B∪C)=(A∪B)∪C
A∩(B∩C)=(A∩B)∩C
- 分配律 A∩(B∪C)=(A∩B)∪(A∩C)
A∪(B∩C)=(A∪B)∩(A∪C)
- 对偶律 A∪Bˉ=Aˉ∩Bˉ,A∩Bˉ=Aˉ∪Bˉ
∪i=1nAiˉ=∩i=1nAiˉ,∩i=1nAiˉ=∪i=1nAiˉ
设试验E的样本空间为Ω,称实值函数P为概率,如果P满足如下三条件:
- 对于任意事件A,有P(A)≥0
- 对于必然事件Ω,有P(Ω)=1
- 对于两两互斥的可数无穷个事件A1,A2,⋯,An,⋯,有P(A1∪A2⋯∪An∪⋯)=P(A1)+P(A2)+⋯+P(An)+⋯,称P(A)为事件A的概率
定义 设A,B为两事件,且P(A)>0,称
P(B∣A)=P(A)P(AB)
为在事件A发生的条件下事件B发生的条件概率
定义 设A,B两事件满足等式
P(AB)=P(A)P(B)
则称A与B相互独立
设A1,A2,⋯,An是n个事件,如果对于任意k(1<k≤n),任意1≤i1<i2<⋯<ik≤n满足等式
P(Ai1Ai2⋯Aik)=P(Ai1)P(Ai2)⋯P(Aik)
则称A1,A2,⋯,An为相互独立的事件
注:n个事件相互独立需要Cn2+Cn3+⋯+Cnn=2n−n−1个等式成立
- P(∅)=0
- 对于两两互斥的有限个事件A1,A2,⋯,An,有P(A1∪A2∪⋯∪An)=P(A1)+P(A2)+⋯+P(An)
- P(Aˉ)=1−P(A)
- A⊂B,则P(A)≤P(B)
- 0≤P(A)≤1
注:条件概率也是概率,条件概率也有概率相应的各性质
- A与B相互独立的充要条件是A与Bˉ或Aˉ与B或Aˉ与Bˉ相互独立
- 当0<P(A)<1时,A与B独立等价于P(B∣A)=P(B)或P(B∣A)=P(B∣Aˉ)成立
- 若A1,A2,⋯,An相互独立,则A1,A2,⋯,An必两两独立。反之,若A1,A2,⋯,An两两独立,则A1,A2,⋯,An不一定相互独立
- 当A1,A2,⋯,An相互独立时,它们的部分事件也是相互独立的
将相互独立的n个事件中任何几个事件换成它们相应的对立事件,则这新组成的n个事件也相互独立
-
加法公式 P(A∪B)=P(A)+P(B)−P(AB)
P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(BC)−P(AC)+P(ABC)
-
减法公式 P(A−B)=P(A)−P(AB)
-
乘法公式
当P(A)>0时,P(AB)=P(A)P(B|A);
当P(A1A2⋯An−1)>0时,
P(A1A2⋯An)=P(A1)P(A2∣A1)⋯P(An∣A1A2⋯An−1)
-
全概率公式
设B1,B2,⋯,Bn满足∪i=1nBi=Ω,BiBj=∅(i=j)且P(Bk)>0,k=1,2,⋯,n,则对任意事件A有
P(A)=i=1∑nP(Bi)P(A∣Bi)
称满足∪i=1nBi=Ω和BiBj=∅(i=j)的B1,B2,⋯,Bn为Ω的一个完备事件组
-
贝叶斯公式
设B1,B2,⋯,Bn满足∪i=1nBi=Ω,BiBj=∅(i=j)且P(A)>0,P(Bk)>0,k=1,2,⋯,n,则
P(Bj∣A)=∑i=1nP(Bi)P(A∣Bi)P(Bj)P(A∣Bj),j=1,2,⋯,n
注:
- 概率计算中常要结合对偶律应用性质P(Aˉ)=1−P(A)
- 计算相互独立事件的概率时,常将事件之间的“并”或“差”转化成“交”来计算。因为事件的独立性是用事件的交的概率来定义的。而将相互独立事件中某个或某几个事件换成相应的对立事件并不影响它们之间的相互独立性,所以讲“并”和“差”化成交后,常常会带来计算上的方便。例如,A和B独立时,
P(A∪B)=1−P(AˉBˉ)=1−P(Aˉ)P(Bˉ)
P(A−B)=P(ABˉ)=P(A)P(Bˉ)
零概率事件与任何事件都相互独立。同样对概率为1的事件B,有P(Bˉ)=0,即Bˉ与任何事件相互独立,也就有B与任何事件相互独立
定义 当试验结果为有限n个样本点,且每个样本点的发生具有相等的可能性,如果事件A由nA个样本点组成,则事件A的概率
P(A)=nnA=样本点总数A所包含的样本点数
称有限等可能试验中事件A的概率P(A)为古典型概率
定义 当试验的样本空间是某区域(该区域可以是一维、二维或三维等等),以L(Ω)表示其几何度量(长度、面积、体积等等)。L(Ω)为有限,且试验结果出现在Ω中任何区域的可能性只与该区域几何度量成正比。事件A的样本点所表示的区域为ΩA,则事件A的概率
P(A)=L(Ω)L(ΩA)=Ω的几何度量ΩA的几何度量
称这种样本点个数无限但几何度量上的等可能试验中事件A的概率P(A)为几何型概率
定义 把一随机试验独立重复做若干次,即各次试验所联系的事件之间相互独立,且同一事件在各个试验中出现的概率相同,称为独立重复试验
如果每次试验只有两个结果A和Aˉ,则称这种试验为伯努利试验。将伯努利试验独立重复进行n次,称为n重伯努利试验
设在每次试验中,概率P(A)=p(0<p<1),则在n重伯努利试验中事件A发生k次的概率,又称为二项概率公式:Cnkpk(1−p)n−k,k=0,1,2,⋯,n
一般来说,如果一个概率同时可用有序和无序的样本空间来计算时,常常用无序要简单些;同时可用两种样本空间计算时,常常用较小的样本空间要简单些
ex=i=0∑+∞i!xi
定义 在样本空间Ω上的实值函数X=X(ω),ω∈Ω,称X(ω)为随机变量,简记X
注:X(ω)的定义域是Ω,常用X,Y,Z等表示随机变量
定义 对于任意实数x,记函数F(x)=P{X≤x},−∞<x<+∞,称F(x)为随机变量X的分布函数
分布函数F(x)是定义在(−∞,+∞)上的一个实值函数,F(x)的值等于随机变量X在区间(−∞,x]内取值的概率,即事件X≤x的概率
有的书上将分布函数定义成F(x)=P{X<x},考试大纲要求是F(x)=P{X≤x}
- 0≤F(x)≤1;x→−∞limF(x)=0,记为F(−∞)=0;x→+∞limF(x)=1,记为F(+∞)=1
- F(x)是单调非减函数,即当x1<x2时,F(x1)≤F(x2)
- F(x)是右连续的,即F(x+0)=F(x)
- 对任意x1<x2,有P{x1<X≤x2}=F(x2)−F(x1)
- 对任意的x,P{X=x}=F(x)−F(x−0)
由单调性和F(−∞)=0,F(+∞)=1可以推出0≤F(x)≤1,所以性质1.,2.,3.可以简化为:F(−∞)=0,F(+∞)=1;单调非减;右连续
这恰是函数F(x)成为某一随机变量的分布函数的充要条件
当F(x)在x处连续时,F(x)−F(x−0)=0,根据性质5.,就有P{X=x}=0
定义 如果一个随机变量的可能取值是有限多个或可数无穷多个,则称它为离散型随机变量
定义 设离散型随机变量X的可能取值是x1,x2,⋯,xn,⋯,X取各可能值的概率为
P{X=xk}=pk,k=1,2,⋯
称上式为离散型随机变量X的概率分布或分布律
分布律也有用列表方式给出的
定义 如果对随机变量X的分布函数F(x),存在一个非负可积函数f(x),使得对任意实数x,都有
F(x)=∫−∞xf(t)dt,−∞<x<+∞
称X为连续型随机变量,函数f(x)称为X的概率密度
注:连续型随机变量的分布函数F(x)必可表示成F(x)=∫−∞xf(t)dt,所以这时的F(x)一定是(∞,+∞)上的连续函数,反之,不能说凡是连续的F(x)对应的X一定是连续型随机变量
连续型随机变量的F(x)必连续,但f(x)不一定是连续的
- pk≥0,k=1,2,⋯
- k=1∑+∞pk=1
- f(x)≥0
- ∫−∞+∞f(x)dx=1
- 对任意实数x1<x2,有P{x1<X≤x2}=∫x1x2f(t)dt
- 在f(x)的连续点处有F′(x)=f(x)
函数f(x)成为某一连续型随机变量的概率密度充要条件是f(x)具有性质1和2
如果X是连续型随机变量,则显然有
P{x1<X≤x2}=P{x1≤X<x2}=P{x1<X<x2}=P{x1≤X≤x2}
定义 如果随机变量X有分布律
0<p<1,则称X服从参数为p的0-1分布,或称X具有0-1分布
定义 如果随机变量X有分布律
P{X=k}=Cnkpkqn−k,k=0,1,2,⋯,n
其中0<p<1,q=1−p,则称X服从参数为n,p的二项分布,记作X∼B(n,p)
在n重伯努利试验中,若每次实验成功率为p(0<p<1),则在n次独立重复试验中成功的总次数X服从二项分布
当n=1时,不难验证二项分布就退化成0-1分布,所以0-1分布也可以记为B(1,p)
定义 如果随机变量X的分布律为
P{X=k}=pqk−1,k=1,2,⋯
其中0<p<1,q=1−p,则称X服从参数为p的几何分布,或称X具有几何分布
注:在独立地重复做一系列伯努利试验中,若每次试验成功率为p(0<p<1),则在第k次试验时才首次试验成功的概率服从几何分布
定义 如果随机变量X的分布律为
P{X=k}=CNnCMkCN−Mn−k,k=l1,⋯,l2
其中l1=max(0,n−N+M),l2=min(M,n),则称随机变量X服从参数为n,N,M的超几何分布
如果N件产品中含有M件次品,从中任意一次取出n件(或从中一件接一件不放回地取n件),令X=抽取的n件产品中的次品件数,则X服从参数为n,N,M的超几何分布
如果N件产品中含有M件次品,从中一件接一件有放回地取n次(即每次取出记录后就放回,再取下一个),则X服从B(n,NM)
定义 如果随机变量X的分布律为P{X=k}=k!λke−λ,k=0,1,2,⋯,其中λ>0为常数,则称随机变量X服从参数为λ的泊松分布,记为X∼P(λ)
注:在一段时间内电话总机接到的呼叫次数、候车的旅客数、保险索赔的次数等都服从泊松分布
定义 如果连续型随机变量X的概率密度为
f(x)={b−a1,0,a≤x≤b其他
则称X在区间[a,b]上服从均匀分布,记作X∼U[a,b]
如果概率密度为
f(x)={b−a1,0,a<x<b其他
则称X在区间(a,b)上服从均匀分布,记作X∼U(a,b)
注:无论上述哪种情况,它们的分布函数均为
F(x)=⎩⎪⎪⎨⎪⎪⎧0,b−ax−a,1,x<aa≤x<bb≤x
定义 如果连续型随机变量X的概率密度为
f(x)={λe−λx,0,x>0,x≤0λ>0
则称X服从参数为λ的指数分布,记作X∼E(λ)
设X∼E(λ),则X的分布函数为
F(x)={1−e−λx,0,x>0x≤0λ>0
指数分布有很多应用,有许多种寿命的分布都近似地服从指数分布
定义 如果随机变量X的概率密度为
f(x)=sπσ1e−2σ2(x−μ)2,−∞<x<+∞
其中μ,σ为常数且σ>0,则称X服从参数为μ,σ的正态分布,记作
X∼N(μ,σ2)
当μ=0,σ2=1时,即X∼N(0,1),称X服从标准正态分布,此时用φ(x)表示X的概率密度,即φ(x)=2π1e−2x2,−∞<x<+∞
注 X∼N(μ,σ2),其分布函数为
F(x)=2πσ1∫−∞xe−2σ2(t−μ)2dt
当X∼N(0,1)时,分布函数用Φ(x)表示
Φ(x)=2π1∫−∞xe−2t2dt
-
泊松定理:在伯努利试验中,pn代表事件A在试验中出现的概率,它与试验总数n有关,如果n→∞limnpn=λ,则
n→∞limCnkpnk(1−pn)n−k=k!λke−λ
注 应用泊松定理的要求:n较大(n≥100),p较小(p≤0.1),np不太大。这时有近似公式
Cnkpk(1−p)n−K≈k!(np)ke−np
-
设X∼U[a,b],则对a≤c<d≤b,有
P{c<X≤d}=b−ad−c
即随机变量落入区间[c,d]的概率等于该区间长度与[a,b]长度之比
-
设X∼E(λ),则有
- P{X>t}=∫t+∞λe−λtdt=e−λt,t>0
- P{X>t+s∣X>s}=P{X>s}P{X>t+s}=e−λse−λ(t+s)=e−λt=P{X>t},t,s>0
此性质称为指数分布具有“无记忆性”
-
设X∼N(μ,σ2),其分布函数为F(x),则
- F(x)=Φ(σx−μ)
- P{a<X≤b}=Φ(σb−μ)−Φ(σa−μ),a<b
- 概率密度f(x)关于x=μ对称,φ(x)是偶函数
- Φ(−x)=1−Φ(x),Φ(0)=21
- 当X∼N(0,1),有P{∣X∣≤a}=2Φ(a)−1
定义 设X=X(ω),Y=Y(ω)是定义在样本空间Ω上的两个随机变量,则称向量(X,Y)为二维随机变量,或随机向量
定义 F(x,y)=P{X≤x,Y≤y},−∞<x<+∞,−∞<y<+∞
二维随机变量(X,Y)的分布函数为F(x,y),分别称FX(x)=P{X≤x}和FY(y)=P{Y≤y}为(X,Y)关于X和关于Y的边缘分布
注:显然,边缘分布FX(x)和FY(y)与二维随机变量F(x,y)有如下关系:
FX(x)=P{X≤x}=P{X≤x,Y<+∞}=F(x,+∞)
FY(y)=P{Y≤y}=P{X<+∞,Y≤y}=F(x,+∞)
这里F(x,+∞)应理解为y→+∞limF(x,y)
定义 如果对于任意给定的ε>0,P{y−ε<Y≤y+ε}>0
ε→0+limP{X≤x∣y−ε<Y≤y+ε}=ε→0+limP{y−ε<Y≤y+ε}P{X≤x,y−ε<Y≤y+ε}
存在,则称此极限为在条件Y=y下X的条件分布,记作FX∣Y(x∣y)或P{X≤x∣Y=y}
类似地可定义FY∣X(y∣x)
定义 如果随机变量(X,Y)可能取值为有限个或可数无穷个(xi,yj),i,j=1,2,⋯,则称(X,Y)为二维离散型随机变量
定义 二维离散型随机变量(X,Y)的可能取值为(xi,yj)(i,j=1,2,⋯)称
P{X=xi,Y=yj}=pij,i,j=1,2,⋯
为二维离散型随机变量(X,Y)的概率分布或分布律
注:也可以用表格形式表示分布律
定义
pi⋅=P{X=xi},i=1,2,⋯
p⋅j=P{Y=yj},j=1,2,⋯
分别称为(X,Y)关于X和关于Y的边缘分布
定义 对给定的j,如果P{Y=yj}>0,j=1,2,⋯,则称
P{X=xi∣Y=yj}=P{Y=yj}P{X=xi,Y=yj}=p⋅jpij,i=1,2⋯
为在Y−yj条件下随机变量X的条件分布
定义 如果对随机变量(X,Y)的分布F(x,y)存在非负函数f(x,y),使得对于任意实数x和y,都有
F(x,y)=∫−∞x∫−∞yf(u,v)dudv,−∞<x,y<+∞
则称(X,Y)为二维连续型随机变量,函数f(x,y)称为(X,Y)的概率密度
对连续型随机变量(X,Y),设它的概率密度为f(x,y),由FX(x)=F(x,+∞)=∫−∞x[∫−∞+∞f(x,y)dy]dx知道,X也是一个连续型变量,且其概率密度为fX(x)=∫−∞+∞f(x,y)dy
定义 fX(x)=∫−∞+∞f(x,y)dy和fY(y)=∫−∞+∞f(x,y)dx
被分别称为(X,Y)关于X和关于Y的边缘密度
定义 设f(x,y)在点(x,y)连续,fY(y)连续且fY(y)>0,则条件分布
FX∣Y(x∣y)=∫−∞xfY(y)f(s,y)ds
其中fY(y)f(x,y)被称为在条件Y=y下的条件密度,记作fX∣Y(x∣y),即
fX∣Y(x∣y)=fY(y)f(x,y),fY(y)>0
类似地可定义,当fX(x)>0时,
fY∣X(y∣x)=fX(x)f(x,y)和FY∣X(y∣x)=∫−∞yfX(x)f(x,s)ds
- 对任意x,y,均有0≤F(x,y)≤1
- F(−∞,y)=F(x,−∞)=F(−∞,−∞)=0
F(+∞,+∞)=1
- F(x,y)关于x和关于y均单调不减
- F(x,y)关于x和关于y是油连续的
- P{a<X≤b,c<Y≤d}=F(b,d)−F(b,c)−F(a,d)+F(a,c)
- pij≥0,i,j=1,2,⋯
- i∑j∑pij=1
- f(x,y)≥0
- ∫−∞+∞∫−∞+∞f(x,y)dxdy=1
- 随机变量(X,Y)落在区域D内的概率
P{(X,Y)∈D}=∬Df(x,y)dxdy
定义 如果对任意x,y都有
P{X≤x,Y≤y}=P{X≤x}P{Y≤y}
即
F(x,y)=FX(x)FY(y)
则称随机变量X与Y相互独立
- 离散型随机变量X和Y相互独立的充要条件:对任意i,j=1,2,⋯成立
P{X=xi,Y=yj}=P{X=xi}P{Y=yj}
即pij=pi⋅p⋅j
- 连续型随机变量X和Y相互独立的充要条件:对任意的x,y,成立
f(x,y)=fX(x)fY(y)
注:可将两个随机变量的独立性推广到两个以上随机变量的情形
定义 如果二维连续型随机变量(X,Y)的概率密度为
f(x,y)={A1,0,(x,y)∈G其他
其中A是平面有界区域G的面积,则称(X,Y)服从区域G上的均匀分布
定义 如果二维连续型随机变量(X,Y)的概率密度为
f(x,y)=2πσ1σ21−ρ21exp{−2(1−ρ2)1[σ2(x−μ1)2−σ1σ22ρ(x−μ1)(y−μ2)+σ22y−μ2)2]},−∞<x<+∞,−∞<y<+∞
其中μ1,μ2,σ1>0,σ2>0,−1<ρ<1均为常数,则称(X,Y)服从参数为μ1,μ2,σ1,σ2和ρ的二维正态分布,记作
(X,Y)∼N(μ1,μ2;σ12,σ22;ρ)
-
设(X,Y)在G上服从均匀分布,D是G中的一个部分区域,记它们的面积分别为SD和SG,则P{(X,Y)∈D}=SGSD
如果设(X,Y)的概率密度为f(x,y),显然
f(x,y)={SG1,0,(x,y)∈G其他
而P{(X,Y)∈D}=∬Df(x,y)dxdy=∬DSG1dxdy=SGSD
-
对正态分布不加证明地要求记住下列性质:
- (X,Y)∼N(μ1,μ2;σ12,σ22;ρ)时,X与Y均服从一维正态:
X∼N(μ1,σ12),Y∼N(μ2,σ22)
- (X,Y)∼N(μ1,μ2;σ12,σ22;ρ)时,X与Y相互独立的充分必要条件是ρ=0
- (X,Y)服从二维正态时,行列式∣∣∣∣∣acbd∣∣∣∣∣=0,(aX+bY,cX+dY)也服从二维正态,当然aX+bY服从一维正态
- 约定:X与Y均服从一维正态,且相互独立,就是指(X,Y)服从二维正态,且ρ=0
注:如果X与Y均服从一维正态,不能保证(X,Y)服从二维正态,也就不能保证aX+bY服从一维正态;
如果X与Y均服从一维正态,且相互独立,则aX+bY必正态(a2+b2=0)
Z的分布律的求法与一维离散型类似
FZ(z)的求法,可用公式
FZ(z)=P{Z≤z}=P{g(X,Y)≤z}=∬g(x,y)≤zf(x,y)dxdy
特别当Z=X+Y时,
FZ(z)=P{X+Y≤z}=∬x+y≤zf(x,y)dxdy=∫−∞+∞dx∫−∞z−xf(x,y)dy(或∫−∞+∞dy∫−∞z−yf(x,y)dx)
由此可得Z=X+Y的概率密度为
fZ(z)=∫−∞+∞f(x,z−x)dx
或fZ(z)=∫−∞+∞f(z−y,y)dy
特别是当X和Y相互独立时,f(x,y)=fX(x)fY(y),则
fZ(z)=∫−∞+∞fX(x)fY(z−x)dx
或
fZ(z)=∫−∞+∞fX(z−y)fY(y)dy
这两个公式成为卷积公式,记为fX∗fY
注:随机变量的简单函数通常包括线性函数、初等函数、最大值、最小值、绝对值等
一般对离散型随机变量X的各种可能取值用全概率公式把它们展开,如下:
X |
x_1 |
x_2 |
\cdots |
x_i |
\cdots |
P |
p_1 |
p_2 |
\cdots |
p_i |
\cdots |
Y为连续型,Z=g(X,Y)则
FZ(z)=P{Z≤z}=P{g(X,Y)≤z}=i∑P{X=xi}P{g(X,Y)≤z∣X=xi}=i∑piP{g(xi,Y)≤z∣X=xi}
定义
-
离散型随机变量的数学期望
设随机变量X的概率分布为
P{X=xk}=pk,k=1,2,⋯
如果级数k=1∑+∞xkpk绝对收敛,则称此级数为随机变量X的数学期望或均值,记作E(X),即E(X)=k=1∑+∞xkpk
-
连续型随机变量的数学期望
设随机变量X的概率密度为f(x),如果积分∫−∞+∞xf(x)dx绝对收敛,则称此积分为随机变量X的数学期望或均值,记作E(X),即
E(X)=∫−∞+∞xf(x)dx
- 设C是常数,则有E(C)=C
- 设X是随机变量,C是常数,则有
E(CX)=CE(X)
- 设X和Y是任意两个随机变量,则有
E(X±Y)=E(X)±E(Y)
- 设随机变量X和Y相互独立,则有
E(XY)=E(X)E(Y)
注:性质4要求X和Y的相互独立,可以减弱为X和Y不相关就有E(XY)=E(X)E(Y)。事实上E(XY)=E(X)E(Y)成立的充要条件是X和Y不相关
-
设随机变量X的概率分布为
P{X=xk}=pk,k=1,2,⋯
如果级数k=1∑+∞g(xk)pk绝对收敛,则随机变量Y=g(X)的数学期望为
E(Y)=E[g(X)]=k=1∑+∞g(xk)pk
-
设随机变量X的概率密度为f(x),如果积分∫−∞+∞g(x)f(x)dx绝对收敛,则随机变量Y=g(X)的数学期望为
E(Y)=E[g(X)]=∫−∞+∞g(x)f(x)dx
-
设随机变量(X,Y)的概率分布为
P{X=xi,Y=yj}=pij,i,j=1,2,⋯
如果级数i=1∑+∞j=1∑+∞g(xi,yj)pij绝对收敛,则随机变量Z=g(X,Y)的数学期望为
E(Z)=E[g(X,Y)]=i=1∑+∞j=1∑+∞g(xi,yj)pij
-
设随机变量(X,Y)的概率密度为f(x,y),如果积分∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy绝对收敛,则随机变量Z=g(X,Y)的数学期望为
E(Z)=E[g(X,Y)]=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
定义 设X是随机变量,如果数学期望E{[X−E(x)]2}存在,则称之为X的方差,记作D(X),即
D(X)=E{[X−E(X)]2}
称D(X)为随机变量X的标准差或均方差,记作σ(X),即σ(X)=D(X)
D(X)=E(X2)−[E(X)]2
由于对任何随机变量X,D(X)≥0,故恒有
E(X2)≥[E(x)]2
有时在已知X的数学期望与方差时,还用此公式求E(X2)
- 设C是常数,则D(C)=0,反之,从D(X)=0中不能得出X为常数的结论
- 设X是随机变量,a和b是常数,则有
D(aX+b)=a2D(X)
- 设随机变量X和Y相互独立,则有
D(X±Y)=D(X)+D(Y)
注:性质3要求X和Y相互独立,可以减弱为X和Y不相关就有D(X±Y)=D(X)+D(Y)。事实上D(X±Y)=D(X)+D(Y)成立的充要条件是X和Y不相关
- 0-1分布
E(X)=p,D(X)=p(1−p)
- 二项分布,X∼B(n,p)
E(X)=np,D(X)=np(1−p)
- 泊松分布,X∼P(λ)
E(X)=λ,D(X)=λ
- 几何分布,P{X=k}=p(1−p)k−1,k=1,2,⋯,0<p<1
E(X)=p1,D(X)=p21−p
- 均匀分布,X∼U(a,b)
E(X)=2a+b,D(X)=12(b−a)2
- 指数分布,X∼E(λ)
E(X)=λ1,D(X)=λ21
- 正态分布,X∼N(μ,σ2)
E(X)=μ,D(X)=σ2
定义
- 设X是随机变量,如果
E(Xk),k=1,2,⋯
存在,则称之为X的k阶原点矩
- 设X是随机变量,如果
E{[X−E(X)]k},k=1,2,⋯
存在,则称之为X的k阶中心矩
- 设X和Y是两个随机变量,如果
E(XkYl),k,l=1,2,⋯
存在,则称之为X和Y的k+l阶混合矩
- 设X和Y是两个随机变量,如果
E{[X−E(X)]k[Y−E(Y)]l},k,l=1,2,⋯
存在,则称之为X和Y的k+l阶混合中心矩
定义 对于随机变量X和Y,如果E{[X−E(X)][Y−E(Y)]}存在,则称之为X和Y的协方差,记作Cov(X,Y),即
Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}
定义 对于随机变量X和Y,如果D(X)D(Y)=0,则称D(X)D(Y)Cov(X,Y)为X和Y的相关系数,记为ρXY,即
ρXY=D(X)D(Y)Cov(X,Y)
如果D(X)D(Y)=0,则ρXY=0
定义 如果随机变量X和Y的相关系数ρXY=0,则称X和Y不相关
- Cov(X,Y)=E(XY)−E(X)E(Y)
- D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
- 协方差性质
- Cov(X,Y)=Cov(Y,X)
- Cov(aX,bY)=abCov(X,Y),其中a,b是常数
- Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
- ∣ρXY∣≤1
- ∣ρXY∣=1的充分必要条件是存在常数a和b,其中a=0,使得
P{Y=aX+b}=1
- 如果随机变量X和Y相互独立,则X和Y必不相关;反之,X和Y不相关时,X和Y却不一定相互独立
- 对二维正态随机变量(X,Y),X和Y相互独立的充分必要条件是ρ=0
- 对二维正态随机变量(X,Y),X和Y相互独立与X和Y不相关是等价的
设随机变量X的数学期望E(X)和方差D(X)存在,则对任意的ε>0,总有
P{∣X−E(X)∣≥ε}≤ε2D(X)
设X1,X2,⋯,Xn,⋯是一个随机变量序列,A是一个常数,如果对任意ε>0,有
n→+∞limP{∣Xn−A∣<ε}=1
则称随机变量序列X1,X2,⋯,Xn,⋯依概率收敛于常数A,记作XnPA
设X1,X2,⋯,Xn,⋯为两两不相关的随机变量序列,存在常数C,使D(Xi)≤C(i=1,2,⋯),则对任意ε>0,有
n→∞limP{∣∣∣∣∣∣n1i=1∑nXi−n1i=1∑nE(Xi)∣∣∣∣∣∣<ε}=1
设随机变量Xn∼B(n,p),n=1,2,⋯,则对于任意ε>0,有
n→+∞limP{∣∣∣∣∣nXn−p∣∣∣∣∣<ε}=1
设随机变量X1,X2,⋯,Xn,⋯独立同分布,具有数学期望E(Xi)=μ,i=1,2,⋯,则对任意ε>0有
n→+∞limP{∣∣∣∣∣∣n1i=1∑nXi−μ∣∣∣∣∣∣<ε}=1
设随机变量Xn∼B(n,p)(n=1,2,⋯),则对于任意实数x,有
n→+∞limP{np(1−p)Xn−np≤x}=Φ(x)
其中Φ(x)是标准正态的分布函数
注:定理表明当n充分大时,服从B(n,p)的随机变量Xn经标准化后得np(1−p)Xn−np近似服从标准正态分布N(0,1),或者说Xn近似服从N(np,np(1-p))
设随机变量X1,X2,⋯,Xn,⋯独立同分布,具有数学期望与方差,E(Xn)=μ,D(Xn)=σ2,n=1,2,⋯,则对于任意实数x,有
n→∞limP⎩⎪⎪⎪⎨⎪⎪⎪⎧nσi=1∑nXi−nμ≤x⎭⎪⎪⎪⎬⎪⎪⎪⎫=Φ(x)
注:定理表明当n充分大时i=1∑nXi的标准化nσi=1∑nXi−nμ近似服从标准正态分布N(0,1),或者说i=1∑nXi近似地服从N(nμ,nσ2)
定义 数理统计中所研究对象的某项数量指标X的全体称为总体
注:X是一个随机变量,称X的概率分布为总体分布,X的数字特征为总体数字特征,总体中的每个元素称为个体
定义 如果X1,X2,⋯,Xn相互独立且都与总体X同分布,则称X1,X2,⋯,Xn为来自总体的简单随机样本,简称为样本。n为样本容量,样本的具体观测值x1,x2,⋯,xn称为样本值,或称总体X的n个独立观测值
注 如果总体X的分布为F(X),则样本X1,X2,⋯,Xn的分布为
Fn(x1,x2,⋯,xn)=i=1∏nF(xi)
如果总体X有概率密度f(x),则样本X1,X2,⋯,Xn的概率密度为
fn(x1,x2,⋯,xn)=i=1∏nf(xi)
如果总体X有概率分布P{X=aj}=pj,j=1,2,⋯,则样本X1,X2,⋯,Xn的概率分布为
P{X1=x1,X2=x2,⋯,Xn=xn}=i=1∏nP{Xi=xi}
其中xi取a1,a2,⋯中的某一个数
定义 样本X1,X2,⋯,Xn的不含未知参数的函数T=T(X1,X2,⋯,Xn)称为统计量
注:作为随机样本的函数,统计量本身也是一个随机变量
如果x1,x2,⋯,xn时样本X1,X2,⋯,Xn的样本值,则数值T(x1,x2,⋯,xn)为统计量T(X1,X2,⋯,Xn)的观测值
下面所列的样本数字特征、顺序统计量都是最常用的统计量
设X1,X2,⋯,Xn是来自总体X的样本,则称
- 样本均值 Xˉ=n1i=1∑nXi
- 样本方差 S2=n−11i=1∑n(Xi−Xˉ)2
样本标准差 S=n−11i=1∑n(Xi−Xˉ)2
- 样本k阶原点距 Ak=n1i=1∑nXik,k=1,2,A1=Xˉ
- 样本k阶中心距 Bk=n1i=1∑n(Xi−Xˉ)k,k=1,2,B2=nn−1S2=S2
- 如果总体X具有数学期望E(X)=μ,则
E(Xˉ)=E(X)=μ
- 如果总体X具有方差D(X)=σ2,则
D(Xˉ)=n1D(X)=nσ2, E(S2)=D(X)=σ2
- 如果总体X的k阶原点距E(Xk)=μk,k=1,2,⋯存在,则当n→∞时
n1i=1∑nXikPμk,k=1,2,⋯
定义 设随机变量X1,X2,⋯,Xn相互独立且均服从标准正态分布N(0,1),则称随机变量χ2=X12+X22+⋯+Xn2服从自由度为n的χ2分布,记作χ2∼χ2(n)
注:n个相互独立标准正态随机变量的平方和χ2=X12+X22+⋯+Xn2又称为χ2(n)的典型模式,必须熟记
- 设χ2∼χ2(n),对给定的a(0<a<1),称满足条件
P{χ2>χα2(n)}=∫χα2(n)+∞f(x)dx=α
的点χα2(n)为χ2(n)分布上α分位点。对不同的α和n,χα2(n)通常通过查表求得
- 设χ2∼χ2(n),则E(χ2)=n,D(χ2)=2n
- 设χ12∼χ2(n1),χ22∼χ2(n2),且χ12和χ22相互独立,则χ12+χ22∼χ2(n1+n2)
定义 设随机变量X和Y相互独立,且X∼N(0,1),Y∼χ2(n),则称随机变量
T=Y/nX
服从自由度为n的t分布,基座T∼t(n)
注:满足X,Y独立,X∼N(0,1),Y∼χ2(n)三条件的T=Y/nX称为t(n)的典型模式
- t分布的概率密度f(x)是偶函数,即f(x)=f(-x),且当n充分大时,t(n)分布近似于N(0,1)分布
- 设T∼t(n),对给定的α(0<α<1),称满足条件
P{T>tα(n)}=∫ta(n)+∞f(x)dx=α
的点ta(n)为t(n)分布上α分位点
- 由于t(n)分布的概率密度为偶函数,可知t分布的双侧α分位点tα/2(n),即
P{∣T∣>tα/2(n)}=α
显然t1−α(n)=−tα(n)
定义 设随机变量X和Y相互独立,且X∼χ2(n1),Y∼χ2(n2),则称随机变量
F=Y/n2X/n1
服从自由度为(n1,n2)的F分布,基座F∼F(n1,n2),其中n1和n2分别称为第一自由度和第二自由度
注:满足X,Y独立,X∼χ2(n1),Y∼χ2(n2)三条件的F=Y/n2X/n1称为F(n1,n2)的典型模式
-
设F∼F(n1,n2),对给定的α(0<α<1),称满足条件
P{F>Fα(n1,n2)}=∫Fα(n1,n2)+∞f(x)dx=α
的点Fα(n1,n2)为F(n1,n2)分布的上α分位点
-
如果F∼F(n1,n2),则F1∼F(n2,n1),且有
F1−α(n1,n2)=Fα(n2,n1)1
设总体X∼N(μ,σ2),X1,X2,⋯,Xn是来自总体的样本,样本均值为Xˉ,样本方差为S2,则有:
- Xˉ∼N(μ,nσ2),U=σ/nXˉ−μ∼N(0,1)
- Xˉ与S2相互独立,且χ2=σ2(n−1)2S2∼χ2(n−1)
- T=S/nXˉ−μ∼t(n−1)
- χ2=σ21i=1∑n(Xi−μ)2∼χ2(n)
设总体X∼N(μ1,σ12)和总体Y∼N(μ2,σ22),X1,X2,⋯,Xn1和Y1,Y2,⋯,Yn2是分别来自总体X和Y的样本且相互独立,样本均值分别为Xˉ和Yˉ,样本方差分别为S12和S22,则有
-
Xˉ−Yˉ∼N(μ1−μ2,n1σ12+n2σ22),U=sqrtn1σ12+n1σ2(Xˉ−Yˉ)−(μ1−μ2)∼N(0,1)
-
如果σ12=σ22,则
T=Sωn11+n21Xˉ−Yˉ−(μ1−μ2)∼t(n1+n2−2)
其中Sω2=n1+n2−2(n1−1)S12+(n2−1)S22
-
F=S22/σ22S12/σ12∼F(n1−1,n2−1)
概率统计中常涉及积分∫0+∞x2e−xdx,或更一般地要计算积分∫0+∞xne−xdx我们不难推导∫0+∞xne−xdx=n∫0+∞xn−1e−xdx=⋯=n!
定义 用样本X1,X2,⋯,Xn构造的统计量θ^(X1,X2,⋯,Xn)来估计未知参数θ称为点估计。统计量θ^(X1,X2,⋯,Xn)称为估计量
注:估计量是随机变量,它所取得的观测值θ^(x1,x2,⋯,xn)称为估计值。有时将θ的估计量和估计值统称为θ的估计
定义 设θ^是θ的估计量,如果E(θ^)=θ,则称θ^=θ^(X1,X2,⋯,Xn)是未知参数θ的无偏估计量
定义 设θ^1和θ^2都是θ的无偏估计量,且D(θ^1)≤D(θ^2),则称θ^1比θ^2更有效,或θ^1比θ^2更有效估计量
定义 设θ^(X1,X2,⋯,Xn)是θ的估计值,如果θ^依概率收敛于θ,则称θ^(X1,X2,⋯,Xn)为θ的一致估计量
定义 用样本矩估计响应的总体矩,用样本矩的函数估计总体矩相应的函数,然后求出要估计的参数,称这种估计法为矩估计法
设总体X的分布含有未知参数θ1,θ2,⋯,θk,αl=E(Xl)存在,显然它是θ1,θ2,⋯,θk的函数,记作αl(θ1,θ2,⋯,θk),l=1,2,⋯,k。样本的l阶原点矩为Al=n1i=1∑nXil,令
αl(θ1,θ2,⋯,θk)=Al,l=1,2,⋯,k
从这k个方程组中,可以解得θ1,θ2,⋯,θk
矩估计法不需要知道总体的具体分布数学形式,只要知道各阶矩存在
如果不同原点矩,而用中心矩也可以求解:用样本中心距等于总体中心距来建立方程组
求k个参数的估计一般就列出以借据到k阶矩的方程。考试大纲只要求最多两个参数的估计,故一般最多两个方程
设g(α1,α2)是一阶矩α1和二阶矩α2的函数,而α^1和α^2分别为α1和α2的矩估计,则g(α^1,α^2)就是g(α1,α2)的矩估计
设X1,X2,⋯,Xn是来自总体X的样本,x1,x2,⋯,xn是样本值,θ是待估参数
定义 对于离散型总体X,设其概率分布为P{X=αi}=p(αi,θ),i=1,2,⋯,称函数
L(θ)=L(X1,X2,⋯,Xn;θ)=i=1∏np(Xi;θ)
为参数θ的似然函数
对于连续型总体X,概率密度为f(x;θ),则称函数
L(θ)=L(X1,X2,⋯,Xn;θ)=i=1∏nf(Xi;θ)为参数θ的似然函数
定义 对于给定的样本值(x1,x2,⋯,xn),使似然函数L(x1,x2,⋯,xn;θ)达到最大值的参数值θ^=(^x1,x2,⋯,xn)称为未知参数θ的最大似然估计值,相应的使似然函数L(X1,X2,⋯,Xn;θ)达到最大值的参数值θ^=θ^(X1,X2,⋯,Xn)称为θ的最大似然估计量。一般统称为θ的最大似然估计。称这种估计法为最大似然估计法
如果L(θ)或lnL(θ)关于θ可微,值θ^往往可以从方程
dθdL(θ)=0或dθdlnL(θ)=0
中求解,称这两个方程为似然方程
如果要估计的参数是两个,θ1和θ2,则得似然方程组
{∂θ1∂L(θ)=0∂θ2∂L(θ)=0或{∂θ1∂lnL(θ)=0∂θ2∂lnL(θ)=0
解这两个方程组,可以得到θ1^和θ2^
有时,使L(θ)或lnL(θ)达到最大值的θ^不一定是L(θ)或lnL(θ)驻点,这时不能用似然方程来求解,应采用其他方法求最大似然估计
定义 设θ是总体X的未知参数,X1,X2,⋯,Xn是来自总体X的样本,对于给定的α(0<α<1),如果两个统计量满足
P{θ1<θ<θ2}=1−α
则称随机区间(θ1,θ2)为参数θ的置信水平(或置信度)为1−α的置信区间(或区间估计),简称为θ的1−α置信区间,θ1和θ2分别称为置信下限和置信上限
设总体X∼N(μ,σ2),X1,X2,⋯,Xn是来自总体X的样本,Xˉ是样本均值,S2是样本方差。下表列出了μ和σ2的1−α置信区间
未知参数 |
1−α置信区间 |
μ,已知σ2 |
(Xˉ−u2αnσ,Xˉ+u2αnσ) |
μ,未知σ2 |
(Xˉ−t2α(n−1)nS,Xˉ+t2α(n−1)nS) |
σ2 |
(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2) |
设总体X∼N(μ1,σ12)和总体Y∼N(μ2,σ22),X1,X2,⋯,Xn1和Y1,Y2,⋯,Yn2分别是来自总体X和Y的样本。Xˉ,S12,Yˉ,S22是相应的样本均值和样本方差
Sω2=n1+n2−2(n1−1)S12+(n2−1)S22
下表列出了μ1−μ2和σ22σ12的1−α置信区间
未知参数 |
1−α置信区间 |
μ1−μ2,已知σ12,σ22 |
(Xˉ−Yˉ−u2αn1σ12+n2σ22,Xˉ−Yˉ+u2αn1σ12+n2σ22) |
μ1−μ2,未知σ12,σ22,但σ12=σ22 |
(Xˉ−Yˉ−t2α(n1+n2−2)Sωn11+n21,Xˉ−Yˉ+t2α(n1+n2−2)Sωn11+n21) |
σ22σ12 |
(S22S12⋅F2α(n1−1,n2−1)1,S22S12F2α(n2−1,n1−1)) |
小概率事件在一次试验中实际上是不会发生的,实际推断原理又称小概率原理
- 假设是指关于总体的论断或命题,常用字母"H"表示,假设分为基本假设H0(又称原假设,零假设)和备选假设(又称备择假设,对立假设)。还可将假设分为参数假设和分参数假设,参数假设是指已知总体分布函数形式,对其中未知参数的假设,其他的假设就是非参数假设,也可将假设分为简单假设和复合假设。完全决定总体分布的假设为简单假设,否则为复合假设。
- 假设检验:根据样本,按照一定规则判断所做假设H0的真伪,并作出接受还是拒绝接受H0的决定
拒绝实际真的假设H0(弃真)称为第一类错误
接受实际不真的假设H0(纳伪)称为第二类错误
- 显著性水平:在假设检验中允许犯第一类错误的概率,记为α(0<α<1),则α称为显著水平,它表现了对H0弃真的控制程度,一般α取0.1,0.05,0.01,0.001等值
- 显著性检验:只控制第一类错误概率α的统计检验,称为显著性检验
- 显著性检验的一般步骤
- 根据问题要求提出原假设H0
- 给出显著性水平$\alpha(0<\alpha<1)
- 确定检验统计量及拒绝域形式
- 按犯第一类错误的概率等于α,求出拒绝域W
- 根据样本值计算检验统计量T的观测值t,当t∈W时,拒绝原假设H0;否则,接受原假设H0
设显著性水平为α,单个正态总体为N(μ,σ2)的参数的假设检验以及两个正态总体N(μ1,σ12)与N(μ2,σ22)的μ1−μ2和σ12=σ22的假设检验