在概率论和统计学中,超几何分布是一种离散概率分布,它描述的是从有限总体中进行不放回抽样时成功次数的概率分布。例如,在一个装有红球和白球的袋子里随机抽取若干个球,而这些球没有被放回的情况下,我们关心抽到多少个红球的问题。
超几何分布的基本定义
假设有一个总数为 \( N \) 的总体,其中包含 \( K \) 个特殊元素(比如红球)。如果我们从中随机抽取 \( n \) 个样本(不放回),那么抽到的特殊元素数量 \( X \) 就服从超几何分布。其概率质量函数为:
\[
P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}, \quad k = 0, 1, 2, \ldots, \min(K, n)
\]
这里,\( \binom{a}{b} \) 表示组合数,即从 \( a \) 个不同元素中选取 \( b \) 个的方式数。
超几何分布的期望
对于超几何分布来说,其数学期望(即平均值)可以通过以下公式计算:
\[
E[X] = n \cdot \frac{K}{N}
\]
这个公式的直观理解是:如果每次抽样都等概率地选择任何一个球,那么预期抽取到的特殊元素的比例应该接近于总体中的比例。
超几何分布的方差
除了期望之外,方差也是衡量随机变量波动程度的重要指标。对于超几何分布而言,其方差可以表示为:
\[
Var[X] = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N-n}{N-1}
\]
需要注意的是,这里的分母 \( N-1 \) 是因为我们在不放回抽样的情况下计算方差时需要考虑修正因子。
应用实例
超几何分布在实际应用中非常广泛,尤其是在质量控制、生物统计以及市场调研等领域。例如,在生产线上的产品检测中,若已知一批产品的合格率为 \( p \),通过随机抽样来评估这批产品质量是否符合标准时,就可以利用超几何分布来进行分析。
总之,掌握好超几何分布的期望与方差公式不仅有助于解决理论问题,还能帮助我们更好地理解和处理现实世界中的各种不确定性事件。