1.两点分布
如果随机变量(X) 的分布列如下:
$$\begin{array}{l}P{X=1}=p\bigl(0<p<1\bigr)\\P{X=0}=q=1-p\end{array}$$
则称(X) 服从两点分布。两点分布也叫伯努利分布(Bermoulli)或0-1分布。
两点分布虽简单但很有用。当随机试验只有2个可能结果,且都有正概率时,就确定一个服从两点分布的随机变量。例如检查产品质量是否合格:检查某车间的电力消耗是否超寸负荷:某射丰对目标的一次射击是否中靶等试验都可以用服从一点分布的随利变量来描谜
2.二项分布
如果随机变量(X) 的概率分布为:
$$P(X)=k=C_{_n}^kp^kq^{n-k},\mathrm{k}=0,1,2,\cdots,n,0<p<1,q=1-p$$
则称(X) 服从参数为(n,p) 的二项分布。其中,二项定理的系数计算方法如下:
$$C_n^k=\frac{n!}{k!(n-k)!}$$
二项分布记为(X\sim B(n,p)) 或(X\sim b(n,p))
服从二项分布的随机变量的直观背景可解释为:重复服从二项分布的实验(n) 次,某事件(A) 发生的次数(X) 是服从二项分布的随机变量。
二项分布有什么用呢?假设遇到一个事情,如果该事情发生次数固定,而想要统计的是成功的次数,那么就可以用二项分布的公式快速计算出概率来,
如何判断是不是二项分布?顾名思义,二项代表事件有2种可能的结果,把一种称为成功;另外一种称为失败。生活中有很多这样2种结果的二项情况,例如表白结果是二项的一种成功:另一种是失败。二项分布符合下面4个特点
(1)做某件事的次数(也叫试验次数)是固定的,用(n) 表示。
(2)每一次事件都有两个可能的结果(成功,或者失败)。
(3)每一次成功的概率都是相等的,成功的概率用(p) 表示
(4)感兴趣的是成功(x) 次的概率是多少。
例题:某一仪器由3个相同的独立工作的元件构成。该仪器工作时每个元件发生故障的概率为0.1。试求该仪器工作时发生故障的元件数(X) 的分布列。
设(X) 为随机变量,可以取以下的数值: (X=0) (仪器中没有一个元件发生故障): (X=1) (仪器中有一个元件发生故障): (X=2) (仪器中有两个元件发生故障): (X=3) (仪器中有三个元件发生故障)
若将对每个元件的一次观察看成一次试验,因每次观察的结果只有2个:发生故障或正常。而发生故障的概率都是0.1,又因为各元件发生故障与否是相互独立的,因此属于二项分布。即(X\sim B(3,0.1)) 。于是(X) 的分布列为:
$$\begin{aligned}
&P{X=k}=C_{k}^{3}\left(0.1\right)^{k}\left(0.9\right)^{3-k},k=0,1,2,3 \\
&P{X=0}=0.9^{3}=0.729 \\
&P{X=1}=C_{3}^{1}(0.1)(0.9)^{2}=0.243 \\
&P{X=2}=C_{3}^{2}(0.1)^{2}(0.9)=0.027 \\
&P{X=3}=0.1^{3}=0.001
\end{aligned}$$
这里读者别害怕数学公式,每一项的含义前面已经讲的很清楚了。这个公式就是计算做某件事情(n) 次,成功(x) 次的概率。很多数据分析工具(Excel,Python,R)都提供了计算工具,只要代入研究问题的数值,就能得到结果
最后提一下二项分布的期望: (E(x)=np) 。表示某事情发生(n) 次,预期成功多少次。那么知道这个期望有什么用呢?做任何事情之前,知道预期结果肯定会对后面的决策有帮助, 比如抛硬币5 次,每次概率是1/2,那么期望(E(x)=5\times\frac{1}{2}=2.5) 次,也就是有大约3 次可以抛出正面。再比如投资了5支股票,假设每支股票赚到钱的概率是(80\%) ,那么期望(E(x)=5\times80\%=4) ,也就是预期会有4只股票投资成功赚到钱,
3.几何分布
几何分布实际上与二项分布非常的像,先来看几何分布的4个特点:
(1)做某件事的次数(也叫试验次数)是固定的,用(n) 表示(2)每一次事件都有两个可能的结果(成功,或者失败)。(3)每一次成功的概率都是相等的,成功的概率用(p) 表示(4)感兴趣的是进行(x) 次尝试这个事情,取得第1次成功的概率是多大。
正如读者所看到的,几何分布和二项分布的区别只有第4点,也就是解决问题目的不同, 几何分布的数学公式如下:
$$p(x)=(1-p)^{x-1}p$$
其中(p) 为成功概率,即为了在第(x) 次尝试取得第1次成功,首先要失败((x-1)) 次
假如在表白之前,计算出即使尝试表白3次,在最后1次成功的概率还是小于(50\%) 还没有抛硬币的概率高。那就要考虑换个追求对象。或者首先提升下自己,提高自己每一次表白的概率。
最后,几何分布的期望是(E(x)=1/p) 。假如每次表白的成功概率是(60\%) ,同时也符合几何分布的特点,所以期望(E(x)=1/p=1/0.6=1.67) 。这意味着表白1.67次(约等于2次)会
成功。这样的期望让表白发起者信心倍增,起码不需要努力上100次才能成功,2次还是能做到的,有必要尝试下。
4.泊松分布
如果随机变量(X) 的概率分布为:
$$P{X}=k=\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,\cdots $$
其中常数(\lambda>0) ,则称(X) 服从参数为(\lambda) 的泊松分布,记为(X\sim P(l))。(k) 代表事情发生的次数入代表给定时间范围内事情发生的平均次数。
那么泊松分布有什么用?如果想知道某个时间范围内,发生某件事情(x) 次的概率是多大。这时候就可以用泊松分布轻松搞定。比如一天内中奖的次数,一个月内某机器损坏的次数等。
知道这些事情的概率有什么用呢?当然是根据概率的大小来做出决策了。比如组织一次抽奖活动,最后算出来一天内中奖10次的概率都超过了(90\%) ,然后进行期望和活动成本的比较,发现要赔不少钱,那这个活动就别组织了。
泊松分布符合以下3个特点:
(1)事件是独立事件。
(2)在任意相同的时间范围内,事件发的概率相同,
(3)想知道某个时间范围内,发生某件事情(x) 次的概率是多大。
例如组织了一个促销抽奖活动,只知道1天内中奖的平均个数为4个,想知道1天内恰巧中奖次数为8的概率是多少?
$$P(X)=8=\frac{4^8e^{-4}}{8!}=0.0298$$
最后,泊松概率还有一个重要性质,它的数学期望和方差相等,都等于。
5.离散型数据分布小结
1)概率分布的作用?
下次遇到类似的问题,就可以直接套用“模板”(这些特殊分布的规律)来求得概率了。
2)常见的离散概率分布有哪些?
(1)二点分布:表示一次试验只有两种结果即随机变量(X) 只有两个可能的取值。
(2)二项分布:感兴趣的是成功(x) 次的概率是多少。
(3)几何分布:感兴趣的是进行(x) 次尝试这个事情,取得第1次成功的概率是多大。
(4)泊松分布:想知道某个时间范围内,发生某件事情(x) 次的概率是多大。
3)二点分布和二项分布的区别?
两点分布是试验次数为1的伯努利试验而二项分布是试验次数为(n) 次的伯努利试验。
暂无评论内容