ch10-概率
{/* label: chap:ch10 */}
{/* latex-label: fig:monty-hall */} \begin{figure}[htbp]
\end{figure} 圖:蒙提霍尔問題示意圖:玩家初選门1后,主持人揭示门3為山羊
你的直觉可靠吗?谈谈蒙提霍尔問題 這是一個源自美国電视游戏的著名谜題:舞台上有三扇關闭的门,其中一扇门后面是一辆汽车,另外两扇门后面各是一只山羊. 你選择了一扇门(比如门1),但暂时不能打開. 此时,知道门后真相的主持人,会打開剩下两扇门中的一扇,并向你展示其后面是一只山羊(比如他打開了门3).
接着,他問你:“你想要坚持你最初的選择(门1),还是換成剩下那扇未打開的门(门2)?” 你的第一感觉可能是什么?既然门3已經被排除了,剩下门1和门2,汽车在其中一扇门后的机会似乎是均等的,也就是各有一半的可能. 那么,換與不換,结果應该没什么区别.
{/* latex-label: fig:monty-hall-cases */} \begin{figure}[htbp]
\end{figure} 圖:蒙提霍尔問題:穷举所有可能情况(假设玩家初選门1)
但這個直觉是完全錯誤的. 事实上,交換選择会使你赢得汽车的机会翻倍! 為什么我们那看似“合理”的直觉会失效?要揭開這個谜題背后的真相,我们需要一套能够精确量化“可能性”大小的數學工具. 這套工具,就是概率論. 它将教会我们如何超越直觉,用严谨的逻辑来分析和應對世界的不确定性.
事件與概率
{/* label: sec:ch10-s01 */}
概率論的迷人之处在于,它為我们提供了一套严谨的數學語言,用以描述和量化我们日常生活中无处不在的不确定性. 抛硬币的簡單游戏便是其應用的一個很好的例子. 概率論是理解、預测和驾驭随机現象的核心工具. 在本章中,我们将從最基本的概念——事件——開始,逐步構建起整個初步概率論的高楼大厦.
随机试验與事件
在我们能够讨論“可能性”的大小之前,我们首先需要精确地定義我们正在谈論的是什么. 概率論的起点是随机试验.
一個過程或试验,如果它满足以下三個基本特征,我们便称之為一個随机试验:
- 可重複性: 试验可以在相同的条件下重複進行.
- 可知性: 试验的所有可能结果是明确已知的.
- 不确定性: 在每次试验之前,我们无法預知哪個具體结果会出現.
- 抛掷一枚硬币: 我们可以在相同条件下重複抛掷,所有可能结果是“正面”或“反面”,但每次抛掷前我们不知道具體是哪一面朝上.
- 掷一颗骰子: 所有可能结果是点數 .
- 记錄某路口一小时内通過的汽车數量: 所有可能结果是 .
- 從区間 上随机取一個數: 所有可能结果是该区間内的任何一個实數.
對于一個随机试验,我们将它所有可能的基本结果的集合称為样本空間,通常用大寫希腊字母 (Omega) 表示. 样本空間中的每一個元素,即每一個不能再分解的基本结果,称為一個样本点.
随机试验 的所有可能结果構成的集合称為 的样本空間, 记為 . 样本空間 中的元素,即试验的每一個基本结果,称為样本点.
- 抛掷一枚硬币一次,记“正面”為 H,“反面”為 T. 样本空間為 .
- 掷一颗骰子一次,样本空間為 .
- 抛掷一枚硬币两次,记錄每次的结果. 样本空間為 .
- 從装有2個红球和3個白球的袋中,不放回地抽取2個球. 若我们關心的是球的颜色组合,则样本空間可设為 . 若我们對每個球加以区分(例如 ),则样本空間会複杂得多. 如何恰当地定義样本空間,取决于我们關心的問題是什么.
上面最后一個例子中的提醒,道出了各位同學在寫題的时候必须要注意到的一点,定義样本空間不僅是罗列结果,更要用上你的大脑. 其核心哲學在于:我们構建的样本空間并非物理世界的唯一真实寫照,而是一個為解决特定問題而服务的數學模型.
模型的選择
\paragraph{等可能性} 在應用古典概型时,一個根本性的要求是样本空間中的所有样本点必须是“等可能的”. 然而,“等可能性”往往不是一個先验的物理事实,而是我们在建模时做出的一种理想化假设. 一個优秀的建模者懂得如何通過巧妙地定義样本点,来创造出一個满足等可能性的样本空間.
一個袋中装有2個红球和2個白球,除颜色外完全相同. 從中不放回地随机抽取2個球,求抽到2個红球的概率是多少?
對于這個试验,我们至少可以構想出两种不同的样本空間.
模型一:基于“结果”的样本空間 (不区分同色球) 如果我们只關心最终抽出的颜色组合,可能的结果有:“两红”、“一红一白”、“两白”. 于是我们構建样本空間:
如果我们草率地认為這三個结果是等可能的,就会得出 的錯誤结論. 這個模型虽然直观,但其样本点并非等可能,因為它忽略了不同球之間的差异,從而压缩了信息.
模型二:基于“過程”的样本空間 (区分同色球) 為了構建一個样本点等可能的空間,我们必须引入一种“虚拟的”区分. 即使這些球在物理上无法分辨,我们可以在數學上给它们贴上標签:. 這样,抽取两個球的過程就變成了從這4個可区分的物體中抽取2個. 不考虑顺序,所有可能的组合構成了我们的新样本空間:
這個样本空間共有 個样本点. 由于每個球被抽到的机会均等,我们可以合理地假设這6個组合是等可能的.
現在我们来考察事件 :“抽到2個红球”. 在 中, 這個事件對應于子集 . 该事件只包含了1個样本点. 根据古典概型,正确的概率是:
這個對比清晰地揭示了建模的哲學,通過在數學上将物理不可区分的物體视為可区分,我们“创造”了一個具有等可能性質的样本空間,從而使得古典概型的强大威力得以應用. 好的样本空間,其美妙之处在于它将一個複杂的、非等可能的問題,转化為一個簡單的、等可能的组合计數問題.
样本空間的構建还依赖于我们關心的問題的细节层次. 一個過于粗糙的样本空間可能会丢失解决問題所需的關键信息,而一個過于精细的样本空間则可能徒增不必要的计算複杂性. 例如,在连續抛掷三次硬币的试验中,如果我们關心的是“恰好出現两次正面”的概率,那么记錄每次抛掷结果的有序样本空間 是必要的. 而如果只關心正面的总數, 構造的样本空間 虽然合法,但其样本点并非等可能,反而增加了计算难度.
事件的定義與表示
在定義了样本空間之后,我们便可以定義事件. 在日常語言中,事件指的是“發生的事情”.
样本空間 的任意一個子集 (),称為一個随机事件,簡称事件. 当且僅当一次试验的结果(即样本点)属于子集 时, 我们称事件 發生.
這個定義是現代概率論的基石. 它巧妙地将一個随机、不确定的概念(事件的發生)與一個确定、严谨的數學對象(集合)联係了起来.
考虑掷一颗骰子的试验,其样本空間為 . 以下是一些事件的例子:
- 事件 : “掷出的点數為偶數”. 作為一個集合, .
- 事件 : “掷出的点數大于4”. 作為一個集合, .
- 事件 : “掷出的点數為7”. 這是一個不可能發生的情况, 對應的集合是空集 .
- 事件 : “掷出的点數小于10”. 這是一個必然發生的情况, 對應的集合是整個样本空間 .
從這個例子中,我们可以看到两种特殊的事件:
- 必然事件:每次试验中必定發生的事件. 它對應于整個样本空間 .
- 不可能事件:每次试验中都绝不会發生的事件. 它對應于空集 .
事件的运算與關係
既然事件就是集合,那么集合論中的各种關係和运算,就自然而然地對應了事件之間的逻辑關係. 掌握這套語言,是精确描述複杂概率問題的第一步. 我们以掷一颗骰子的试验為例,令样本空間 .
若事件 的發生必然導致事件 的發生, 则称事件 包含事件 , 记作 或 .
例子: 令事件 (点數為2或4), 事件 (点數為偶數). 则 ,因為掷出2点或4点,必然意味着掷出了偶數点.
事件“ 與 至少有一個發生”称為 與 的和事件, 记作 .
例子: 令 (点數不大于4), (点數為偶數). 则和事件 ,它表示“点數不大于4,或者点數為偶數”.
事件“ 與 同时發生”称為 與 的積事件, 记作 或 .
例子: 對于上述事件 , 積事件 ,它表示“点數既不大于4,又是偶數”.
若事件 與 不能同时發生, 则称它们為互斥事件或互不相容事件. 在集合上表現為它们的交集是空集, 即 .
例子: 事件 (偶數) 和事件 (奇數) 是互斥的, 因為 .
事件“ 發生而事件 不發生”称為 與 的差事件, 记作 . 显然, 它等价于 .
例子: 令 , . 则差事件 ,表示“点數不大于4,但不是偶數”.
事件“ 不發生”称為 的對立事件或逆事件, 记作 . 它由样本空間 中所有不属于 的元素構成.
特征: 事件 與其對立事件 满足 且 . 即 和 既互斥又完備,它们構成對样本空間的一個划分.
例子: 若事件 (点數不大于4), 则其對立事件為 (点數大于4).
這些事件間的關係和运算,可以通過Venn圖直观地表示出来,這是一种非常有用的思維工具.
\begin{figure}[htbp]
\end{figure} 圖:事件运算的韦恩圖表示
事件的运算满足與集合运算完全相同的定律,例如交換律、结合律、分配律以及德·摩根定律.
對于任意两個事件 和 :
- (“A或B都不發生” 等价于 “A不發生且B不發生”)
- (“A和B不都發生” 等价于 “A不發生或B不發生”)
下圖是一個古典概型的样本空間 和事件 的Venn圖. 已知样本空間的总样本点數 , 事件 包含的样本点數 , 事件 包含的样本点數 , 事件 包含的样本点數 .
\begin{figure}[htbp]
\end{figure}
(1) 求 , , 以及 .
(2) 判断事件 與 是否互斥?是否相互独立?
這是一個綜合运用事件關係和概率基本性質的典型問題.
(1) 计算基本事件的样本点數與概率
首先,我们利用集合的容斥原理计算事件 和 交集(積事件)的样本点數.
将已知數值代入,
解得積事件 (即 ) 的样本点數:
根据古典概型的定義,我们可以计算相關概率. 積事件的概率為
和事件的概率為
對于 ,我们首先應用德·摩根定律.
因此,我们所求的是事件 的對立事件的概率.
(2) 判断事件的關係
關于互斥性:
两個事件互斥的定義是它们的交集為空集,即 . 這等价于 . 從 (1) 的计算中我们已經得到 . 因此,事件 與 不互斥.
關于独立性:
两個事件相互独立的定義是 . 我们需要分别计算等式的两边并進行比较. 從 (1) 我们已知等式左边:
現在我们计算等式右边:
它们的乘積為
由于 成立. 因此,事件 與 相互独立.
高中生李华决定报名參加學校的社团活动,有三种選择:A (ACG社), B (辩論社), C (虚拟联合国). 设 分别表示“李华报名參加了ACG社”、“报名參加了辩論社”、“报名參加了虚拟联合国”這三個事件. 請使用 的运算關係表示下列事件: (1) 李华至少报名參加了一個社团. (2) 李华同时报名參加了全部三個社团. (3) 李华报名參加了ACG社,但没有报名參加辩論社. (4) 李华三個社团都没有报名參加. (5) 李华恰好只报名參加了一個社团.
本題關键在于理解“或”、“且”、“非”等逻辑词與事件运算的對應關係.
(1) “至少报名參加一個社团”意味着“參加了A”或“參加了B”或“參加了C”. 這是三個事件的和事件.
(2) “同时报名參加了全部三個社团”意味着“參加了A”且“參加了B”且“參加了C”. 這是三個事件的積事件.
(3) “报名參加了ACG社,但没有报名參加辩論社”意味着事件 發生且事件 不發生 (即 發生).
(4) “三個社团都没有报名參加”是“至少报名參加一個社团”的對立事件.
根据德·摩根定律,這也可以表示為“没有參加A”且“没有參加B”且“没有參加C”.
(5) “恰好只报名參加一個社团”是一個更複杂的逻辑,它由三個互斥的部分组成:“只參加了A”、“只參加了B”、“只參加了C”. “只參加了A”意味着“參加了A,且没參加B,且没參加C”,即 . 因此,该事件為這三個互斥事件的和事件.
這個練習的核心在于将日常語言的逻辑结構分解,并映射到集合运算上.
某電子设備由两個核心部件構成. 令事件 表示“部件1在一年内失效”, 事件 表示“部件2在一年内失效”. 已知 , , . 求该设備在一年内能正常工作的概率.
首先,我们需要用事件的語言来描述“设備能正常工作”. 设備能正常工作,当且僅当部件1没有失效 并且 部件2没有失效. 這對應于事件 .
直接计算 较為困难,但我们可以利用其與和事件的關係.
根据德·摩根定律,我们知道
這個等式的直观意義是:“两個部件都没坏”恰好是“至少有一個部件坏了”的對立事件.
因此,我们要求的概率是
接下来,我们使用廣義加法公式计算 .
代入已知數据,
最后,我们得到设備正常工作的概率:
某班级有50名學生,參加了數學、物理、化學三科的兴趣小组. 已知參加數學的有30人,物理25人,化學20人. 同时參加數學和物理的有15人,數學和化學10人,物理和化學8人. 三科都參加的有5人. 問: (1) 至少參加一科的有多少人? (2) 恰好只參加一科的有多少人?
设 分别表示參加數學、物理、化學兴趣小组的學生構成的集合. 這是一個典型的容斥原理應用問題.
(1) “至少參加一科”的人數即為 . 根据三事件的容斥原理公式,我们将所有單個事件的基數相加,减去所有两两相交事件的基數,最后再加上三者相交事件的基數:
代入數据:
所以,至少參加一科的有47人. (另外3人什么都没參加).
(2) “恰好只參加一科”的人數需要從总數中剔除參加两科及三科的人. 利用韦恩圖辅助思考会非常清晰. 设 分别為恰好參加一科、两科、三科的人數.
我们已知,三科都參加的人數 人.
接下来计算恰好參加两科的人數. “恰好參加數學和物理两科” (即參加這两科,但不參加化學) 的人數為:
同理,恰好參加物理和化學两科的人數為 . 恰好參加數學和化學两科的人數為 . 所以,恰好參加两科的总人數 人.
最后计算恰好只參加一科的人數. “恰好只參加數學一科”的人數,等于參加數學的总人數,减去所有與數學有交集的“恰好两科”和“三科”的人數:
同理,恰好只參加物理一科的人數為:. 恰好只參加化學一科的人數為:. 所以,恰好只參加一科的总人數 人.
檢验:,與(1)的结果吻合.
證明對于任意两個事件 , 以下等式恒成立:
法一:使用分配律
我们将事件的并集和交集运算類比于數的加法和乘法. 分配律 在這里對應于 . 在本題中,我们可以将事件 看作一個公共部分提取出来.
根据對立事件的定義,一個事件與它的對立事件的交集是不可能事件 .
所以,原式化簡為:
任何事件與不可能事件的并集,都等于其自身.
因此,原等式成立.
法二:逻辑分析
我们分析事件 發生的条件. 该事件發生,意味着 必须發生, 并且 也必须發生.
我们分两种情况讨論:
-
若事件 發生: 此时 必然發生, 也必然發生. 因此整個積事件發生.
-
**若事件 不發生 (即 發生):} 此时要使 發生, 必须要求 發生. 同时, 要使 發生, 必须要求 發生. 那么就要求 和 同时發生,這是不可能的.
綜上所述,该複合事件發生的充要条件就是事件 發生. 故它等价于事件 .
此例題說明,熟練运用事件的运算法则,可以像代數一样簡洁地化簡和證明複杂的事件關係.
從一副標准的52张扑克牌中随机抽取一张. 定義下列事件: : “抽到红桃” : “抽到黑桃” : “抽到红色牌 (红桃或方片)” : “抽到J、Q、K中的一张 (人头牌)”
請判断下列說法的正誤: (1) 事件 與 是互斥的吗? (2) 事件 與 是互斥的吗? (3) 事件 與 是對立事件吗? (4) 事件 與 是對立事件吗? (5) 事件 與 是互斥的吗?
此題旨在厘清“互斥”與“對立”這两個核心且易混淆的概念的区别.
(1) 正确. 一张牌不能既是红桃又是黑桃,所以它们的交集為空,即 .
(2) 錯誤. 红桃本身就是红色的牌. 事件 的發生必然導致事件 的發生, 即 . 因此它们的交集 .
(3) 錯誤. 對立事件必须满足两個条件:① 它们是互斥的 ();② 它们的并集是整個样本空間 (). 從 (1) 可知,事件 和 确实满足互斥的条件. 但是, 它们的并集 代表“抽到红桃或黑桃”, 這并未包含所有可能性, 例如方片和梅花. 因此 . 由于第二個条件不满足,它们不是對立事件.
(4) 正确. 我们来验證對立事件的两個条件. 事件 是“抽到红色牌”, 其對立事件 就是“没有抽到红色牌”,即“抽到黑色牌”. ① 一张牌不能既红又黑,所以 (互斥). ② 任何一张牌非红即黑,所以 (并集為全集). 两個条件都满足,因此它们是對立事件.
(5) 錯誤. 存在一张牌既是红桃又是人头牌,即“红桃J”、“红桃Q”、“红桃K”. 因此 .
互斥僅要求事件不能同时發生 ();而對立则更為严格, 它在互斥的基礎上, 还要求两事件的并集必须穷尽所有可能性 (). 任何對立事件必然互斥,但互斥事件不一定對立.
至此,我们已經建立了描述随机現象中“事件”的語言. 我们将一個不确定的概念——事件——成功地转化為了一個严谨的數學對象——集合. 接下来,我们的任务就是為每一個這样的事件 赋予一個數值 ,用以量化该事件發生的“可能性”的大小. 這就是概率的由来.
概率的定義
在深入探讨概率的严格數學體係之前,让我们先回到一個更符合直觉的問題:当我们說“抛掷一枚均匀硬币,正面朝上的概率是 ”时,這句话究竟意味着什么?
概率的统计定義
最朴素、也最符合科學实验精神的一种想法是,概率是一個事件在大量重複试验中發生的频率的稳定值.
具體来說,我们在相同的条件下對一個随机试验重複進行 次, 其中事件 發生了 次. 我们称比值 為事件 在這 次试验中發生的频率. 大量的实践經验告诉我们,当试验次數 越来越大时, 這個频率 会表現出一种惊人的稳定性,它会围绕着某個固定的數值摆动,且摆动的幅度越来越小. 這個現象被称為大數定律. 于是,一個自然的定義就产生了:
在不變的条件下,重複進行 次试验, 事件 發生的频率 随着 的增大稳定于某一常數 . 我们就称這個常數 為事件 的概率, 记作 .
這個定義将概率與可观测的物理世界联係起来,非常直观. 但作為數學定義,它存在着一些深刻的困难:
比如,它依赖于“频率会稳定于一個常數”這個事实,但這個事实本身就需要用概率論的理論(大數定律)来證明. 用一個需要被證明的结論来作定義,這在逻辑上是不够严谨的.
或者,我们永远无法進行无穷多次试验来求得那個極限值. 任何实际的频率都只是概率的一個近似值.
最后,也是對于实践最不利的,對于很多現实問題,试验根本不具備“重複進行”的可能性. 例如,“明天会下雨的概率”或“某支球队赢得下届世界杯的概率”,這些事件都是一次性的,我们无法“重複”一万個“明天”或一万個“下届世界杯”来统计频率.
由于這些缺陷,统计定義不能作為概率論的逻辑基礎. 于是,數學家们尝试從另一個角度出發.
古典概型及其不足
歷史上最早取得成功的數學定義是古典概型,它避開了重複试验,转而分析试验结果的内在對称性. 它基于一個非常直观的思想:如果一個试验有 個等可能的基本结果, 而事件 包含了其中的 個结果, 那么事件 發生的概率就是 . 這种定義簡洁、易于理解,并且在我们处理像掷骰子、抽扑克牌這類理想化問題时非常有效.
然而,古典概型的應用范围同样有限. 首先,它要求样本空間是有限的;其次,也是更致命的,它依赖于“等可能性”這個无法被定義和验證的前提. 對于一枚質地不均匀的硬币,或一個包含无穷结果的试验(如“從区間 内随机取一個數”),古典概型便无能為力.
概率的公理化定義
為了克服上述定義的局限,我们需要一個更具普适性的概率定義. 這個定義不應依赖于“频率”或“等可能性”的假设,而是從一些最基本的、不證自明的“公理”出發,用逻辑演绎的方式構建起整個概率論的體係. 這就是由苏联數學家安德雷·柯尔莫戈洛夫在1933年提出的概率公理化定義.
它不關心概率的數值從何而来(可以来自频率统计,也可以来自對称性假设),只關心這些數值必须遵守哪些基本的规则.
设 是一個随机试验, 是其样本空間. 對于 中的每一個事件 , 赋予一個实數, 记為 , 称為事件 的概率. 如果這個赋值函數 满足以下三条公理,则称之為一個概率测度.
- 非负性公理: 對于每一個事件 , 有 .
- 规范性公理: 必然事件的概率為1,即 .
- 可加性公理: 若 是一列两两互斥的事件 (即對于任意 , 都有 ),则有
對于有限個互斥事件,此公理同样成立:$P(A_1 \cup ... \cup A_n) = P(A_1) + ... + P(A_n)$.
柯尔莫戈洛夫的定義是數學抽象力量的典范. 它没有告诉我们概率應该如何计算,而是规定了任何一种合理的概率度量必须遵守的根本法则.
首先,“對于... 每一個事件 , 赋予一個实數... 记為 ” 這句话的本質是定義了一個函數. 在高中階段, 我们熟悉的函數, 其定義域和值域通常都是數的集合 (例如 ). 而這里的概率 是一個更廣義的函數:它的定義域是样本空間 的所有事件構成的集合 (函數的自變量不是一個數, 而是一個集合), 其值域则是实數集 (根据公理, 实际上是区間 ). 因此, 的寫法與 完全對應, 它表示“将事件 這個输入,映射到它的概率值這個输出”.
而“概率测度”這一术語,意為“测量”. 就像“长度”是测量一維線段,“面積”是测量二維圖形一样,“概率测度”就是一套用来测量一個事件發生可能性大小的规则. 任何满足下面三条公理的函數 ,都被认為是一种合法的、自洽的“测量”方式.
三条公理的内涵
\paragraph{公理一:非负性 } 這是最基本的要求. 一個事件發生的可能性,最低是“绝不發生”,對應概率為0,但绝不可能比“绝不發生”还低. “-20%的可能性”是毫无意義的. 此公理為概率设定了下界.
\paragraph{公理二:规范性 } 這是為我们的“测量”设定一個單位尺度. “规范性”的意思就是“標准化”. 我们将“必然發生”這件事的确定性程度规定為1 (或者說100%). 于是,所有其他事件的概率都成為了相對于這個“完全确定”的基准的一個比例,自然地落在了0和1之間. 就像我们将1米定義為一個標准长度一样,這里我们将完全的确定性“標定”為1.
\paragraph{公理三:可加性} 對于一係列两两互斥的事件 ,其并集的概率等于它们各自概率的和. 這是三条公理中最核心、最强大的一条,它将整體的概率與局部的概率联係起来.
总之,概率的公理化定義,本質上是為“可能性”這個模糊概念建立了一個數學模型. 它声称:任何一個函數,只要它不产生负值(公理1),把总的可能性校准為1(公理2),并且允许我们将互斥可能性的概率進行相加(公理3),那么它就是一個有效的概率模型.
這三条公理虽然形式簡單,但却是整個概率論的基石,所有我们熟知的概率性質,都可以從這三条公理中推導出来.
不可能事件的概率為零.
我们考虑必然事件 和不可能事件 . 這两個事件是互斥的,因為 . 同时,它们的并集是 .
根据公理3 (可加性),我们有
由于 ,上式變為
再根据公理2 (规范性),,代入得
因此,我们證明了 .
注意:反之不一定成立. 概率為0的事件不一定是不可能事件. 例如,在“從区間[0,1]上随机取一個數”的试验中,取到數字0.5的概率是0,但這显然是一個可能發生的结果.
對于任意事件 , 其對立事件 的概率為
*這個性質極為常用,因為在很多情况下,直接计算事件 的概率较為複杂, 而计算其對立事件 的概率则簡單得多.}
對于任意事件 與其對立事件 , 我们知道它们是互斥的 () 且完備的 ().
根据公理3 (可加性),我们有
又因為 , 根据公理2 (规范性), .
所以,
移項即可得到
對于任意事件 ,其概率介于0和1之間.
该性質包含两個部分: 和 .
第一部分 直接由公理1 (非负性) 给出.
為了證明第二部分 ,我们使用刚刚證明的對立事件概率性質.
根据公理1,任何事件的概率都是非负的,因此 . 所以
綜上所述,我们證明了 .
若事件 包含于事件 (), 则事件 的概率不大于事件 的概率.
并且,事件差的概率為
当 时, 事件 可以被分解為两個互斥部分的并集:事件 和事件 (即属于 但不属于 的部分).
根据公理3 (可加性),我们可以對這個不交并進行分解:
移項可得事件差的概率公式:
根据公理1 (非负性),任何事件的概率都必须大于或等于0. 事件 也不例外,因此
将 代入上式,得到
這便證明了
對于任意两個事件 和 ,它们并集的概率為
為了證明這個公式,我们需要将事件 分解為互斥事件的并,以便使用公理3. 從韦恩圖中可以清晰地看到, 可以表示為三個互斥区域的并集:, , 和 .
一個更簡洁的分解方式是:
其中 與 是互斥的. 根据公理3,
另一方面,我们知道 , 且 與 互斥. 所以 . 由此可得 .
将此表达式代回我们關于 的方程中,即得
這個公式告诉我们,当簡單地将两個事件的概率相加时,我们把它们共同發生的部分 () 计算了两遍, 因此必须减去一次. 這個思想可以推廣到任意多個事件, 并引出著名的容斥原理. 例如, 對于三個事件 :
其中 , .
一些有趣的問題
下面来看更多歷史上的有趣的概率問題,下面的解答或者證明過程可能有些羞涩难懂,并不强求你一開始就理解,但记住一些經典结論总是很好的:
在概率論中,我们經常需要处理大量事件的關係,如果逐一寫出 会非常繁琐. 因此,數學家们發明了一套簡洁的符号係统来表示"多個事件的并集"或"多項概率的和". 理解這套語言是至關重要的.
并集與交集
我们已經知道 表示" 或 發生", 表示" 與 同时發生". 当我们想将其推廣到 個事件 时,我们使用"大"符号:
- 大并集符号 :
這完全等价于 $A_1 \cup A_2 \cup ... \cup A_n$. 它所代表的事件是"$A_1, A_2, ..., A_n$ 中**至少有一個**發生".
- 大交集符号 :
這完全等价于 $A_1 \cap A_2 \cap ... \cap A_n$. 它所代表的事件是"$A_1, A_2, ..., A_n$ **全部都**發生".
生日問題*
我们来探讨一個有趣的問題:
在一個有 個人的房間里 (), 假设每個人的生日等可能地分布在一年365天中的任何一天, 且不考虑闰年. 求至少有两個人生日相同的概率是多少?计算当 时,這個概率大约是多少.
這是一個經典的概率問題,其结果往往與直觉相悖. 直接计算“至少有两人生日相同”的概率比较困难,因為它包含“恰好两人相同”、“恰好三рам相同”、“两對不同的人生日相同”等多种情况. 因此,我们转向其對立事件 :“所有人的生日都不同”. 样本空間 是 個人所有可能的生日组合,每個人都有365种可能,因此
事件 發生的样本点數, 相当于從365天中選出 個不同的生日, 并将其分配给 個人. 其數量為
因此,事件 的概率為
我们要求的“至少有两人生日相同”的概率 就是
当 时,
所以,
令人惊讶的是,僅僅23人的房間,有两個人同一天生日的概率就已經超過了50%.
這個問題有趣的地方在于,我们的直觉失效了,而失效的根本原因,在于我们的大脑倾向于線性思考. 我们可能会錯誤地将問題理解為“我的生日與其他22個人生日相同的概率”,或者簡單地比较人數23與天數365,认為概率應该很低.
然而,問題的真正核心是“任意两個人生日相同的概率”. 關键在于“任意”二字,它引入了组合學的力量. 對于 個人, 总共存在 個可能的配對. 当 时,总共有
這意味着,在一個僅有23人的房間里,存在着253次机会去“中奖”(即找到一對生日相同的人). 尽管單次中奖的概率很低,但在如此多的“抽奖”机会面前,至少中奖一次的概率變得相当高. 我们的直觉未能捕捉到這种由人數增加導致的配對數量的二次方增长.
另外,也有一些很好的想法,比如,正如解法所示,直接处理“至少”一词非常複杂. 而转向其對立事件“所有人生日都不同”则使問題迎刃而解. 這一策略是概率論中的核心技巧.
對立事件的概率 是一個连乘積:
每一個乘上的因子都小于1. 多個小于1的數相乘,其结果会迅速减小. 這种“乘法衰减”效應是指數性的,比我们直觉上的線性减少要快得多. 因此, 会很快地從1下降到0.5以下, 從而使其對立事件 的概率迅速攀升超過0.5.
最后,簡要介绍一下這個問題的應用,生日問題的模型在计算机科學中有着一個至關重要的應用,即哈希碰撞.
其中哈希函數 的作用是将任意长度的數据(如一個文件、一张圖片)映射為一個固定长度的、看似随机的字符串(称為哈希值),如同為數据生成一個“數字指纹”.碰撞 指的是两個不同的原始數据,經過哈希函數计算后,得到了完全相同的哈希值.
哈希值的可能空間(對應生日問題中的365天)通常非常巨大,例如 或 . 然而, 生日問題告诉我们, 我们不需要生成 個不同的文件才能找到一次碰撞. 根据生日問題的近似计算, 我们大约只需要 個文件,就有很高的概率产生一次碰撞.
這個原理是著名的**“生日攻击”**密码學攻击方法的基礎. 攻击者可以利用這個概率原理,以远低于暴力破解的计算量来伪造數字签名或寻找加密算法的弱点. 因此,设计安全的密码係统必须仔细考虑“生日問題”所揭示的碰撞风险.
錯排問題
位客人參加晚宴, 他们都把自己的帽子交给了衣帽間的服务员. 晚宴结束后, 服务员由于匆忙, 将 顶帽子随机地还给了每位客人. 求没有任何一位客人拿到自己帽子的概率 . 当 时,這個概率收敛到何值?
這是一個經典的概率與组合問題. 我们的求解策略遵循古典概型的基本思想.
首先,确定样本空間的总大小. 服务员将 顶不同的帽子随机还给 位客人, 总的排列方式有 种.
接下来,我们需要计算事件 :“没有任何一位客人拿到自己帽子”所包含的样本点數. 這是一個複杂的计數問題. 為此,我们首先需要正式定義這類排列.
一個 個元素的排列, 若其中没有任何一個元素出現在其原来位置上, 则称之為一個 元錯排. 其总數称為錯排數,记為 或 .
例如, 时, 元素 的全排列有 种. 其中錯排為 和 , 故 .
根据此定義,我们要求的事件 的样本点數就是 . 于是, 原概率問題转化為求出 的通項公式.
下面我们用两种核心方法来求解 .
\paragraph{法一:容斥原理} 直接计算“所有人都錯位”的排列數 很困难. 我们可以反過来, 先计算其對立面:“至少有一人拿對自己帽子”的排列數, 然后用总排列數 减去它.
令 為“第 位客人拿到自己帽子”的排列所構成的集合 (). 我们要求的是 . 根据容斥原理:
: 第 位客人拿對帽子, 其余 人任意排, 有 种. 這样的集合有 個. : 第 位客人拿對帽子, 其余 人任意排, 有 种. 這样的集合有 個. 以此類推, 位指定客人拿對帽子的排列數為 , 共有 组.
所以,“至少一人拿對”的总數為:
因此,錯排數 為:
\paragraph{法二:找递推關係} 我们也可以通過分析第 個元素的位置来建立 的递推關係. 考虑元素 . 在一個錯排中, 它不能在第 位, 故它必须在其他 個位置之一, 假设它在第 位 (). 這有 种選择. 對于這個選择, 我们考虑元素 的位置,分两种情况:
-
情况一:元素 恰好在第 位. 這相当于 與 互換位置. 剩下的 個元素需要進行完全錯排, 方法數為 .
-
情况二:元素 不在第 位. 我们已經将 放在了第 位. 對于剩下的 個元素 (除 外的所有元素) 和 個位置 (除 外的所有位置), 問題转化為:将元素 放在非 号位, 且将元素 放在非 号位. 這等价于一個 個元素的錯排問題, 方法數為 .
根据乘法和加法原理,我们得到二階递推關係:
初始值為 . (通過此递推關係亦可推導出通項公式).
現在我们回到最初的概率問題. 利用我们推導出的 通項公式:
当 时, 這個级數收敛到 在 处的泰勒展開式:
结論是,對于一個规模很大的宴会,没有人拿對帽子的概率收敛于一個常數 .
\paragraph{錯排數的性質與公式总结} 通過上述例題的分析,我们得到了關于錯排數的一係列重要结論,現总结如下.
元錯排數 的显式通項公式為:
錯排數 满足以下两個等价的递推關係, 初始值為 :
- (二階递推) , 對于 .
- (一階递推) , 對于 .
*注:在解决具體计數問題时,若 较小, 使用递推關係通常比展開通項公式更快捷. 例如 , . *
個元素的全排列中, 是一個錯排的概率 收敛于 .
對于所有正整數 , 是最接近 的整數. 因此 可以通過四舍五入计算得到:.
這個性質為快速估算甚至精确计算 提供了一個極為便捷的方法.
現在我们来看一些錯排理論在具體問題中的應用.
将4封寫好的不同信件,随机装入寫好對應地址的4個信封中,每個信封恰好装一封信. 求4封信全部装錯信封的装法共有多少种?
這是一個最直接的錯排問題. 元素是4封信,位置是4個信封. 我们要求的就是4個元素的錯排數 . 我们可以直接使用錯排數的通項公式:
当 时,
或者,我们也可以使用递推公式,已知 :
因此,共有9种全部装錯的方法.
虽然使用公式可以快速得到答案,但理解其背后的原理更為重要. 錯排數的通項公式,其本質就是容斥原理 的一個直接應用. 让我们用這個基本原理来手动解出 .
首先,总的排列數(即样本空間大小)為 种. 我们的目標是求“没有任何一封信装對”的情况數. 它的對立事件是“至少有一封信装對”. 我们可以先求出對立事件的數目,再用总數减去它.
设 表示“第 封信装對了信封”這一事件 (). 我们要求的就是
下面我们来计算“至少一封装對”到底有多少种情况.
\paragraph{加上所有“至少一封装對”的情况.} 我们先單独计算每封信装對的情况數,然后把它们全部加起来.
-
如果第1封信装對,剩下3封信任意排列,有 种方法.
-
如果第2封信装對,剩下3封信任意排列,有 种方法.
-
如果第3封信装對,剩下3封信任意排列,有 种方法.
-
如果第4封信装對,剩下3封信任意排列,有 种方法.
我们一共有 种“恰好一封信”的選择. 所以, 初步的总和是 .
\paragraph{减去被重複计算的“至少两封装對”的情况.} 在第一步的计算中,像“第1封和第2封信同时装對”這种情况,在计算“”时被算了一次, 在计算“”时又被算了一次. 所有“两封装對”的情况都被重複计算了. 我们必须把這些多余的减掉.
-
如果第1、2封信都装對,剩下2封信任意排列,有 种方法.
-
我们一共有 對這样的组合((1,2), (1,3), (1,4), (2,3), (2,4), (3,4)).
因此,需要减去的总數是 .
\paragraph{加回被錯誤减去的“至少三封装對”的情况.} 考虑“第1、2、3封信同时装對”的情况. 在第一步中,它被加了3次(在中). 在第二步中, 它又被减了3次(在中). 结果它被完全排除了,但它明明是“至少一封装對”的情况,所以我们需要把它重新加回来.
-
如果第1、2、3封信都装對,剩下1封信也必然装對,有 种方法.
-
我们一共有 组這样的三元组合.
因此,需要加回的总數是 .
\paragraph{减去被錯誤加回的“全部装對”的情况.} 最后,考虑“四封信全部装對”的情况. 它在第一步被加了4次;在第二步被减了次;在第三步又被加了次. 总计被计算了 次. 我们只需要它被计算1次,所以需要减掉多余的1次.
-
四封信全部装對的情况只有 种. ()
因此,需要再减去 .
“至少一封装對”的总情况數 = (第一步) - (第二步) + (第三步) - (第四步)
全部装錯的情况數 就是:
這個结果與公式计算完全吻合,并且清晰地揭示了该問題的组合结構.
三位同學甲、乙、丙,分别坐在1号、2号、3号座位上. 現在让他们重新就座,要求每個人都不能坐在自己原来的位置上. 請問有多少种不同的坐法?
這是一個 的錯排問題. 由于总數很少,我们可以用最基本的方法——枚举法——来解决.
首先,列出所有可能的坐法,即對甲、乙、丙三人的全排列. 括号内的顺序代表坐在1、2、3号座位上的人.
- (甲, 乙, 丙) 所有人都坐對了.
- (甲, 丙, 乙) 甲坐對了.
- (乙, 甲, 丙) 丙坐對了.
- (乙, 丙, 甲) 没有任何人坐對,這是一個錯排.
- (丙, 甲, 乙) 没有任何人坐對,這是另一個錯排.
- (丙, 乙, 甲) 乙坐對了.
通過逐一檢验,我们發現只有第4种和第5种坐法满足“每個人都不能坐在自己原来的位置上”的条件. 因此,共有2种不同的坐法. 這验證了 .
有4個寫着号码1, 2, 3, 4的球,和4個對應号码的盒子. 現将4個球随机放入4個盒子中,每盒一個. 求至少有一個球放進與自己号码相同的盒子的情况有多少种?
這個問題要求的是“至少有一個放對”的情况數. 直接分類讨論“恰好一個對”、“恰好两個對”等会很繁琐. 因此,我们采用补集思想,先计算其對立事件——“所有球都放錯了盒子”——的情况數,即 .
总的放置方法數是4個球的全排列,即 种. 我们用容斥原理来计算 .
令 是“第 号球放進第 号盒”的事件.
-
至少一個放對: 先選出1個球放在正确的盒子里,有 种選法. 剩下3個球任意放, 有 种方法. 总计 种.
-
减去重複计算的“至少两個放對”: 選出2個球放在正确的盒子里,有 种選法. 剩下2個球任意放, 有 种方法. 总计 种.
-
加回錯誤减去的“至少三個放對”: 選出3個球放在正确的盒子里,有 种選法. 剩下1個球只能放在唯一剩下的盒子里, 有 种方法. 总计 种.
-
减去錯誤加回的“全部放對”: 4個球全部放對只有 种方法. 总计 种.
所以,“至少一個球放對”的情况數是 种. 因此,本題的答案就是15种.
注:而所有球都放錯的情况數 则是 种.
一位粗心的药剂师手边有為4位病人准備的4种不同药品. 他随机地将這4种药品分發给了這4位病人,每人一种. 請問,恰好只有两位病人拿到了正确的药品的情况有多少种?
這個問題是一個“部分錯排”問題. 我们可以将其分解為两個独立的步骤,然后使用乘法原理.
選出拿到正确药品的病人. 我们需要從4位病人中,選出2位“幸运儿”,他们拿到了正确的药品. 這不涉及顺序,是一個组合問題. 選择的方法數是 种.
将其余病人進行完全錯排. 對于剩下的2位病人,他们拿到的都必须是錯誤的药品. 设這两位病人是甲和乙,對應的药品是药A和药B. 為了让他们都拿錯,甲必须拿到药B,同时乙必须拿到药A. 所以,2個元素的錯排只有1种方法. 即 .
根据乘法原理,将两步的方法數相乘,得到总的情况數:
因此,恰好只有两位病人拿到正确药品的情况有6种.
書架上有《红楼梦》《西游记》《三国演義》《水浒传》四本書,按從左到右的顺序排好. 現将它们取下后随机放回,求恰好有一本書放回原位的概率.
這是一個结合了古典概型和部分錯排的問題.
计算样本空間总數. 将4本不同的書随机放回,总的排列方法數是 .
计算事件“恰好有一本書放回原位”包含的样本点數. 我们可以把這個過程分解為两個步骤:
- 選出那一本放對的書: 從4本書中選出1本放在它原来的位置上,有 种選择.
- 将其余的書完全錯排: 剩下的3本書,必须全部放在錯誤的位置上. 這是一個3元素的錯排問題,其方法數為 . 我们從例1可知 .
根据乘法原理,恰好有一本書放對的方法數是:
根据古典概型公式 :
因此,恰好有一本書放回原位的概率是 .
還沒有留言。