概率论的基本概念
1.1 随机事件 · 关系与运算
样本空间 Ω:全体样本点 ω 的集合;样本空间的子集称为随机事件。必然事件记 Ω,不可能事件记 ∅。
事件关系:
- 包含
A⊆B:A 发生必导致 B 发生。 - 和事件
A∪B:至少一个发生;积事件AB:同时发生。 - 差事件 \(A-B=A\cap\overline{B}\):A 发生且 B 不发生。
- 对立事件 \(\overline{A}=\Omega-A\);互不相容 \(AB=\varnothing\)。
常用运算律(德摩根律):
事件语言转换(A、B、C 三事件):
- 恰好发生一种:\(A\overline{B}\overline{C}\cup \overline{A}B\overline{C}\cup \overline{A}\overline{B}C\)
- 恰好发生两种:\(AB\overline{C}\cup A\overline{B}C\cup \overline{A}BC\)
- 至少一种:\(A\cup B\cup C\);都不发生:\(\overline{A\cup B\cup C}\)
- “至少一个”用并集,常用对立事件简化;“都发生”是交集。
- “互不相容”只表示不能同时发生;“对立”还要求二者必有一个发生。
1.2 频率与概率 · 加法公式
频率 \(f_n(A)=\dfrac{n_A}{n}\);当 n 增大时频率稳定于常数 p,即概率 \(P(A)=p\)。
基本性质:\(P(\varnothing)=0,\ P(\Omega)=1,\ 0\le P(A)\le1\);\(P(\overline{A})=1-P(A)\);\(P(A-B)=P(A)-P(AB)\)。
加法公式:
- \(P(A)=0\) 不等于事件不可能;\(P(A)=1\) 不等于必然。
- 两事件不互斥时不能直接相加,必须减去交集概率 \(P(AB)\)。
1.3 古典概型与几何概型
古典概型(有限 + 等可能):\(P(A)=\dfrac{m}{n}=\dfrac{\text{有利基本事件数}}{\text{基本事件总数}}\)。
计数:排列 \(A_n^k=\dfrac{n!}{(n-k)!}\)(有序),组合 \(C_n^k=\dfrac{n!}{k!(n-k)!}\)(无序)。
抽样模型(7 黑 3 白,取 3 次):
超几何分布(N 件含 D 件次品,取 n 件恰 k 件次品):
几何概型:\(P(A)=\dfrac{g\text{ 的测度}}{G\text{ 的测度}}\)(长度/面积/体积)。
- 古典概型须同时满足“有限”和“等可能”;计算前先判断是否考虑顺序。
- “无放回”一般不能直接用独立重复试验公式。
1.4 条件概率 · 全概率 · 贝叶斯
条件概率:\(P(B\mid A)=\dfrac{P(AB)}{P(A)}\)(\(P(A)>0\))。
乘法公式:\(P(AB)=P(A)P(B\mid A)=P(B)P(A\mid B)\)。
全概率公式(\(B_1,\dots,B_n\) 是划分):
贝叶斯公式(由结果反推原因):
- 条件概率会改变样本空间;\(P(B\mid A)\ne P(A\mid B)\)。
- 全概率关键是找到互不相容且完备的事件组。
1.5 独立性 · 伯努利试验
独立:\(P(AB)=P(A)P(B)\),等价于 \(P(B\mid A)=P(B)\)。若 A、B 独立,则 \(\overline A,B\) 等也独立。
独立 ≠ 互斥:互斥 \(AB=\varnothing\);有正概率的两事件,互斥与独立不能同时成立。
至少一个发生(独立时):
二项概率(n 重伯努利):
- 两两独立 ⇏ 相互独立(相互独立还要求 \(P(A_1A_2A_3)=P(A_1)P(A_2)P(A_3)\))。
- 无放回抽样一般不是伯努利模型。
随机变量及其分布
2.1–2.2 随机变量与离散型分布律
随机变量 \(X=X(e)\) 把试验结果数值化。离散型 X 的分布律 \(P(X=x_k)=p_k\) 必须满足:
2.3 常见离散型分布(0-1 / 二项 / 泊松)
| 分布 | 分布律 | 记号 / 备注 |
|---|---|---|
| 0-1 分布 | \(P(X=k)=p^k(1-p)^{1-k},k=0,1\) | 两点分布 |
| 二项分布 | \(P(X=k)=C_n^kp^k(1-p)^{n-k}\) | \(X\sim B(n,p)\),n 次独立试验成功次数 |
| 泊松分布 | \(P(X=k)=\dfrac{\lambda^k e^{-\lambda}}{k!}\) | \(X\sim P(\lambda),\lambda>0\) |
泊松近似:n 大、p 小、\(\lambda=np\) 时,\(B(n,p)\approx P(\lambda)\);n=1 时二项分布即 0-1 分布。
2.4 分布函数 F(x)
\(F(x)=P(X\le x)\),性质:\(0\le F\le1\)、单调不减、右连续、\(F(-\infty)=0,F(+\infty)=1\)。
离散型分布函数为阶梯函数,跳跃点对应取值,跳跃高度即该点概率。
2.5 连续型随机变量与密度函数
\(F(x)=\int_{-\infty}^{x}f(t)\,dt\),密度 \(f(x)\) 满足:
连续点处 \(F'(x)=f(x)\);且 \(P(X=a)=0\),故区间端点是否取到不影响概率。
2.6 常见连续型分布(均匀 / 指数 / 正态)
均匀分布 \(X\sim U(a,b)\):\(f(x)=\dfrac{1}{b-a}\,(a 指数分布(率 λ):\(f(x)=\lambda e^{-\lambda x}\,(x>0)\),\(P(X>x)=e^{-\lambda x}\),具无记忆性 \(P(X>s+t\mid X>s)=P(X>t)\)。 正态分布 \(X\sim N(\mu,\sigma^2)\): 标准化 \(Z=\dfrac{X-\mu}{\sigma}\sim N(0,1)\),于是 对称性 \(\Phi(-x)=1-\Phi(x)\),\(P(|Z|
离散型:把相同的 \(g(x_k)\) 取值合并,概率相加。 连续型 · 分布函数法:\(F_Y(y)=P(g(X)\le y)\) 转化为 X 的范围积分,再求导得 \(f_Y(y)=F_Y'(y)\)。 公式法(g 单调可导,反函数 \(x=h(y)\)):\(f_Y(y)=f_X(h(y))\,|h'(y)|\)。 常用结论:\(X\sim N(\mu,\sigma^2),\ Y=aX+b\ (a\ne0)\Rightarrow Y\sim N(a\mu+b,\,a^2\sigma^2)\)。 离散 \(E(X)=\sum_i x_ip_i\);连续 \(E(X)=\int_{-\infty}^{+\infty}xf(x)\,dx\)。 函数期望(无需先求 Y 的分布):\(E[g(X)]=\sum g(x_i)p_i\) 或 \(\int g(x)f(x)\,dx\)。 性质:\(E(C)=C\),\(E(CX)=CE(X)\),\(E(X+Y)=E(X)+E(Y)\);X、Y 独立时 \(E(XY)=E(X)E(Y)\)。 定义 \(D(X)=E[(X-E(X))^2]\),常用计算式: 性质:\(D(C)=0\),\(D(aX+b)=a^2D(X)\);独立时 \(D\big(\sum X_i\big)=\sum D(X_i)\)。 k 阶原点矩 \(\alpha_k=E(X^k)\);k 阶中心矩 \(\mu_k=E[(X-E(X))^k]\)。 重要关系:\(\alpha_1=E(X)\),\(\mu_2=D(X)\)(二阶中心矩即方差)。 辛钦大数定律(独立同分布,\(E(X_i)=\mu\)):样本均值依概率收敛于 μ。 伯努利大数定律:频率 \(\dfrac{m}{n}\) 依概率收敛于概率 p——为“用频率估计概率、样本推断总体”提供依据。 列维–林德伯格(独立同分布,\(E(X_i)=\mu,D(X_i)=\sigma^2\)): 棣莫弗–拉普拉斯(\(X\sim B(n,p)\),n 较大):\(\dfrac{X-np}{\sqrt{npq}}\approx N(0,1)\)。 简单随机样本:\(X_1,\dots,X_n\) 相互独立且与总体同分布。统计量是样本的函数且不含未知参数。 样本均值 \(\overline X=\dfrac{1}{n}\sum X_i\),样本方差 \(S^2=\dfrac{1}{n-1}\sum (X_i-\overline X)^2\)。 χ²:\(\chi^2=\sum_{i=1}^nZ_i^2\sim\chi^2(n)\)(\(Z_i\sim N(0,1)\) 独立)。 正态总体 \(N(\mu,\sigma^2)\) 下:\(\overline X\sim N(\mu,\tfrac{\sigma^2}{n})\),\(\dfrac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)\),且 \(\overline X\) 与 \(S^2\) 独立。 用统计量 \(\hat\theta(X_1,\dots,X_n)\) 估计未知参数 θ(估计量不含未知参数)。 思想:用样本矩估计总体矩。含 k 个参数则令前 k 阶矩相等:\(A_1=\alpha_1,\dots,A_k=\alpha_k\),其中 \(A_1=\overline X,\ A_2=\tfrac{1}{n}\sum X_i^2\)。2.7 随机变量函数的分布 Y=g(X)
随机变量的数字特征
4.1 数学期望 E(X)
分布 期望 E(X) 方差 D(X) 两点 / 伯努利 \(p\) \(p(1-p)\) 二项 \(B(n,p)\) \(np\) \(np(1-p)\) 泊松 \(P(\lambda)\) \(\lambda\) \(\lambda\) 均匀 \(U(a,b)\) \(\dfrac{a+b}{2}\) \(\dfrac{(b-a)^2}{12}\) 指数(率 λ) \(\dfrac{1}{\lambda}\) \(\dfrac{1}{\lambda^2}\) 正态 \(N(\mu,\sigma^2)\) \(\mu\) \(\sigma^2\) 4.2 方差 D(X)
4.4 矩
大数定律与中心极限定理
5.1 大数定律
5.2 中心极限定理
样本及抽样分布
6.1–6.2 基本概念与常用统计量
6.3 三大抽样分布与正态总体结论
t:\(T=\dfrac{Z}{\sqrt{Y/n}}\sim t(n)\);F:\(F=\dfrac{U/m}{V/n}\sim F(m,n)\)。参数估计
7.1–7.2 点估计与评价标准
7.3 矩估计法
分布 矩估计 泊松 \(P(\lambda)\) \(\hat\lambda=\overline X\) 指数(率 λ) \(\hat\lambda=1/\overline X\) 伯努利 \(\hat p=\overline X\) \(B(m,p)\)(m 已知) \(\hat p=\overline X/m\) 正态 \(N(\mu,\sigma^2)\) \(\hat\mu=\overline X,\ \widehat{\sigma^2}=\tfrac{1}{n}\sum(X_i-\overline X)^2\) 均匀 \(U(0,\theta)\) \(\hat\theta=2\overline X\)
Past Paper · 22 Questions
原卷真题逐题精解
单选、填空、计算、应用四种题型。先自己动笔,再点开「显示解析」核对考点、思路与答案;标记已做,进度自动保存到本地。