初等的机率论(5)有限机率空间(Finite Probabi

2020-06-19 9W访问

连结:初等的机率论(4)机率论的瓮模型

摘要:这里针对随机实验所有可能出现结果为有限个的情形,探讨其机率模型,并给出古典机率的定义,根据此定义及其衍伸的演算规则,举出四个例子略作说明。

机率论研究的是随机现象,例如丢铜板、骰子、量子力学、天气、统计物理、命运、股票之涨跌、经济的波动、…等等。机率论又是数理统计学与统计物理学与量子力学的基础。

面对一个随机现象,首先是对一个随机现象作随机实验,可能是真的做实验,也可能只是作个观察(如天气现象)。随机实验会发生什幺结果,事前说不準(uncertainty)。一个事件的发生与否也说不準,于是採用机率的语言来描述事件发生的可能性之大小,例如我们常听说:明天下雨的机率是 $$30{\%}$$($$= 0.3$$);丢一个公正铜板出现正面的机率是 $$1/2$$;丢一个骰子出现三点的机率是 $$1/6$$。

我们要探讨随机实验的机率模型,这是由三个要件组成的:样本空间事件以及机率测度。我们只研究随机实验的所有可能出现结果(outcomes)为有限个的情形,这些结果合成一个集合:

$$\Omega=\{\omega_1,\omega_2,\dots,\omega_N\}$$

叫做样本空间(sample space),其元素叫做样本点(sample point)。对于每一个样本点 $$\omega_k$$ 都指定有机率 $$p_k$$,用来衡量 $$\omega_k$$ 出现的机会之大小。我们自然要假设:

    $$0\le p_k\le 1,~~~k=1,2,\cdots,N$$$$\sum\limits^N_{k=1}p_k=1$$

【注】机率论真正深奥且有趣的情况是样本空间 $$\Omega$$ 为无穷集、甚至是连续统(continuum)$$[0, 1]$$ 的情形。此时必需用到高等的数学──测度积分论。

样本空间 $$\Omega$$ 的任何子集合都叫做事件(event),所有事件的全体记为 $$\mathfrak{A}$$。对于事件 $$ A\in\mathfrak{A}$$,如果随机实验的结果 $$\omega\in A$$,则称事件 $$A$$ 发生了,否则就是不发生。事件 $$\omega$$ 必然发生,叫做铁定事件(sure event),空集 $$\varnothing$$ 永不发生,叫做不可能事件(impossible event)。两事件 $$A,B$$,若具有 $$A\cap B=\varnothing$$,则称它们为互斥事件(disjoint)。$$A\cup B$$ 叫做 $$A$$ 发生或 $$B$$ 发生的事件,$$A\cap B$$ 叫做 $$A$$ 与 $$B$$同时都发生的事件。补集 $$A^c\equiv\Omega\backslash A$$ 叫做 $$A$$ 不发生的事件。

最后还有机率测度 $$P$$ 的概念,用来衡量事件发生的机会之大小:

$$P:\mathfrak{A}\rightarrow [0,1]$$

对于任何事件 $$A\in\mathfrak{A}$$,定义其机率

$$P(A)=\sum\limits_{k\ge 1:\omega_k\in A} p_k$$

值得特别关照的是,当每个样本点发生的机会均等时(Laplace的古典假设)

$$p_1=p_2=\dots =p_N=\frac{1}{N}$$

此时我们有 $$\displaystyle P(A)=\frac{|A|}{|\Omega|} =\frac{|A|}{N}$$,其中$$|\dots|$$表示集合的元素个数。

在这种情形之下,机率的计算通常就是根据排列与组合的点算原则。

三合一空间是指一个初等机率空间$$(\Omega,\mathfrak{A},P)$$,由三个要件组成,这是随机实验的机率模型,是探讨有关此随机实验的所有机率问题之根据地。

根据上述的定义,我们可以直接验证下列常用的机率演算规则。

【定理 3】机率测度 $$P$$ 具有下列性质:

【例3】考虑丢一个公正铜板一次的随机实验。样本空间为 $$\Omega =\{H,T\}$$,其中 $$H$$ 代表「正面」(heads),$$T$$ 代表「反面」(tails)。

由于铜板是公正的,所以 $$\displaystyle p_1=p_2=\frac{1}{2}$$

从而有  $$(\mathrm{a})~~~P(\varnothing)=0\\ (\mathrm{b})~~~P(\{H\})=\frac{1}{2}\\ (\mathrm{c})~~~P(\{T\})=\frac{1}{2}\\ (\mathrm{d})~~~P(\Omega)=P(\{H,T\})=(1/2)+(1/2)=1$$

【例4】考虑丢两个公正骰子一次的随机实验(或一个公正骰子独立丢两次)。

样本空间为 $$\Omega=\{(1,1), (1,2),\dots, (6,6)\}$$(一共有 $$36$$ 个元素)

其中 $$(i,j)$$ 表示丢出第一个骰子为 $$i$$ 点,第二个骰子为 $$j$$ 点。

由于骰子是公正的,所以 $$p_1=p_2=\dots =p_{36}=\frac{1}{36}$$

集合 $$A= \{(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)\}$$ 表示丢出两骰具有相同的点数之事件,其机率为$$P(A)=\frac{6}{36}=\frac{1}{6}$$。

【例5】考虑 $$n$$ 个人,求至少有两人的生日是同一天的机率。

【解答】这是 $$n$$ 个球置于 $$365$$ 个袋子的模型(假设一年有 $$365$$ 天)。

设 $$A$$ 表示至少有两人的生日是同一天的事件,我们要来计算机率$$P(A)$$。

首先,注意到如果 $$n>365$$,那幺显然 $$P(A)=1$$,这是排列与组合学中鸽洞原理的结论。

假设 $$n\leq365$$,则置球的总方法数为 $$365^n$$ 种。

令 $$A$$ 表示至少有两人的生日是同一天的事件,欲求算机率 $$P(A)$$。

但是这不易算,我们改算反面事件 $$A^c$$ 的机率。

$$ A^c$$ 表示没有两球置于同一个袋子里,因此易知

$$\displaystyle P(A^c)=\frac{365\times 364\times\cdots\times(365-n+1)}{365^n}$$

从而 $$\displaystyle P(A)=1-P(A^c)=1-\frac{365\times 364\times\cdots\times(365-n+1)}{365^n}$$

值得注意的是,当 $$n=23$$ 时,$$P(A) > 0.5 $$。因此,一个 $$50$$ 人的班级,发现有两人的生日是同一天,这并不稀奇,因为机率很高。

【例6】(随机配对问题,Random Matching Problem)
糊涂女秘书,将 $$n$$ 封信装入 $$n$$ 个信封,问全部都装错的机率是多少?

【解答】

令 $$A_k$$ 表示第 $$k$$ 封信装对的事件,则 $$A_1\cup{A_2}\cup{\dots}\cup{A_n}$$表示至少有一封信装对的事件。

今因 $$\displaystyle P(A_k)=\frac{(n-1)!\ }{n!\ }=\frac{1}{n},~~~P(A_i\cap A_j)=\frac{(n-2)!\ }{n!\ }=\frac{1}{n(n-1)},\cdots$$

由取捨原理,全部都装错的机率为

$$1-P(A_1\cup A_2\cup\cdots\cup A_n)$$

$$\begin{multline*}=1-\sum\limits^n_{k=1}P(A_k)+\sum\limits^n_{i

$$=\displaystyle 1-1+\frac{1}{2!\ }-\frac{1}{3!\ }+\cdots+(-1)^n\frac{1}{n!\ }$$

注意:由微积分知,当 $$n\to\infty$$ 时,此机率趋近于 $$e^{-1}\fallingdotseq{0.3679}$$。

连结:初等的机率论(6)条件机率与Bayes公式

参考书目:

注:通常要讲述机率论必须用到「测度积分论」的数学工具,或至少要用到微积分。因此要为一般读者介绍机率论的读物诚属不容易。上述八本书尽量压低要用到的数学工具,大部分只需排列与组合,只有少部份要用到一点儿微积分。

从科学方法论的观点来看,机率论与统计学是一体的两面,机率论是「演绎法」,统计学是「归纳法」。因此,本文的主题虽然是机率论,但是也顺便介绍一点点统计学的概念。