对和式求导积分的处理方法,二项(泊松)分布求和转换为Beta(Gamma)分布积分

  |  

摘要: 先求导再积分处理和式的方法,在二项分布、泊松分布求和中的应用。

【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:潮汐朝夕
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


记一个事件 A 在一次试验中发生的概率为 $p$,将此试验独立重复 $n$ 次,记 $X$ 为 A 在这 n 次试验种发生的次数,则 $X$ 可以取 $0, 1, 2, \cdots, n$,服从二项分布 $X \sim B(n, p)$。

对于满足二项分布的这种 n 次试验,很常见的一个问题是事件 A 发生的次数最多为 k 的概率 $P(X \leq k)$ 是多少。也就是要求以下的和式:

我们首先给出结论:

其中分子为 Beta 函数 $Beta(n-k, k+1)$,可以看到本来是二项分布 $B(n, p)$ 从 $0$ 到 $k$ 的求和转化为了 Beta 分布 $Be(n - k, k + 1)$ 从 $0$ 到 $1 - p$ 的积分。

随机变量 X 服从参数为 $\alpha, \beta$ 的 Beta 分布,记为 $X \sim Be(\alpha, \beta)$,其密度函数如下:

有了这个将求和转换为积分的结论之后,一些证明的问题我们就可以引入分析的方法解决了,比如证明 $P(X \leq k)$ 随着 $p$ 的增加而下降就可以通过分析的方法解决。

推导这个结论的过程主要用到了一个对和式或函数项级数求导积分的处理方法,这种技巧在组合恒等式、函数方程等问题中也有应用。本文我们先通过例子来看一下这种处理方法是如何使用的,然后对 $X \sim B(n, p)$ 的 $P(X \leq k)$ 的结论进行推导,最后我们将这种推导方式沿用到泊松分布中,推导出泊松分布 $X \sim P(\lambda)$ 上的求和可以转化为 Gamma 分布 $X \sim \Gamma$ 上的积分。

对有限和式求导积分的处理方法

对于有限和式 $f(x) = \sum\limits_{i}g(i, x)$,在满足条件的前提下,可以尝试用先积分再求导或先求导再积分的方式处理,和式的各项积分(或求导)后可能会凑成等差数列求和、二项式定理、常见函数的泰勒展开等可以直接写出求和结果的形式,从而把求和符号去掉,然后再求导(或积分),既可得到和式的求和结果。

上面的满足条件,指的是和式 $f(x)$ 的各个项 $g(i, x)$ 满足微积分基本定理的条件,由于和式为有限项,由求导、积分的线性性质,可以先逐项求导得到和式的导数 $f’(x)$ 然后对 $f’(x)$ 积分,得到 $f(x)$ 的另一个表达式;类似地,也可以先逐项积分得到和式的积分 $\int_{0}^{x}f(x)dx$ 然后对其求导,得到 $f(x)$ 的另一个表达式。

注意如果和式的项无限,变成了是函数项级数,那么能否逐项求导,逐项积分(也就是函数列的极限与求导、积分交换顺序)还有额外的条件,以一致收敛为核心,具体可以参考文章 积分-级数-极限-求导各种交换顺序

下面我们通过例子看一下先积分再求导以及先求导再积分处理和式是怎么做的。

先积分再求导

对于函数 $f(x)$,如果 $f(x)$ 连续,则根据微积分基本定理可以通过先积分再求导的方式处理 $f(x)$:

微积分基本定理
$f$ 在 $[a, b]$ 连续,则:

比如考虑和式 $f(x) = \sum\limits_{i=0}\limits^{n}(i+1)x^{i}$,该和式各项经过积分后可以凑成等比数列求和

先求导再积分

对于函数 $f(x)$,如果 $f(x)$ 有连续导数,则根据微积分基本定理的另一表述形式,可以通过先求导再积分的方式处理 $f(x)$:

微积分基本定理另一表述形式
若 $f$ 在 $[a, b]$ 有连续导数,则:

下面看一个证明组合恒等式的例子:$\sum\limits_{i=1}\limits^{n}\frac{(-1)^{i+1}}{i}\binom{n}{i} = \sum\limits_{i=0}\limits^{n}\frac{1}{i}$。

考虑和式 $f(x) = \sum\limits_{i=1}\limits^{n}\frac{(-1)^{i+1}}{i}\binom{n}{i}x^{i}$,该和式各项经过求导后可以凑成二项式定理

然后再积分即可得到:

至此我们把和式表示的 $f(x)$ 转化为了变上限积分形式。取 $f(1)$ 即为我们要证明的组合恒等式的等式左边。另一方面 $\frac{1 - (1 - t)^{n}}{t}$ 为等比数列求和的形式,因此:

二项分布求和转换为 Beta 分布的积分

下面我们用先求导再积分的方式推导对于二项分布 $X \sim B(n, p)$ 随机变量,$n$ 次试验中事件 A 发生的次数小于等于 k 的概率。

记 $f(p) = P(X \leq k) = \sum\limits_{i=0}\limits^{k}\binom{n}{i}p^{i}(1-p)^{n-i}$,逐项求导,得:

记上式的左边项为 $g(i) = \binom{n}{i}ip^{i-1}(1-p)^{n-i}$,通过组合恒等式的推导可以发现右边项刚好为 $g(i+1)$,于是:

然后再用微积分基本定理,积分回来,注意 $f(0)$ 表示当 $p = 0$ 时,n 次试验事件 A 发生次数小于等于 k 的概率,因此 $f(0) = 1$,得到:

下面的推导需要一些 $\Gamma$ 函数和 $Beta$ 函数的 3 个结论:

(1) Gamma 函数的定义为 $\Gamma(x) = \int^{\infty}_{0}t^{x-1}e^{-t}dt$,在 $x = n$ 为整数时,有 $\Gamma(n) = (n-1)!$

(2) Beta 函数的定义为 $Beta(a, b) = \int^{1}_{0}t^{a-1}(1-t)^{b-1}dt$,与 $\Gamma$ 函数有以下关系:

(3) 不完全 Beta 函数定义为 $Beta(x; a, b) = \int^{x}_{0}t^{a-1}(1-t)^{b-1}dt$,不完全 Beta 函数除以 Beta 函数的比值称为归一化 Beta 函数,记为:

归一化的 Beta 函数有以下性质:

关于 $\Gamma$ 函数和 $Beta$ 函数,以后在单独研究,这里直接应用结论,基于以上三个结论,有:

至此我们推出了文章开始时的结论,通过对和式求导积分的处理方式,将二项分布 $B(n, p)$ 在 0 到 k 之间的求和 ($P(X\leq k)$) 转换为了 Beta 分布 $Be(n-k, k+1)$ 在 $[0, 1-p]$ 上的积分。

泊松分布求和转换为 Gamma 函数的积分

随机变量 X 服从泊松分布 $X \sim P(\lambda)$,求 $P(X \leq k) = \sum\limits_{i=0}\limits^{k}\frac{1}{i!}\lambda^{i}e^{-\lambda}$。

记 $f(\lambda) = P(X\leq k) = \sum\limits_{i=0}\limits^{k}\frac{1}{i!}\lambda^{i}e^{-\lambda}$,逐项求导:

上式的左边项记为 $g(i) = \frac{e^{-\lambda}\lambda^{i-1}}{(i-1)!}$,可以发现右边项恰好为 $g(i+1)$。于是:

其中有一个 -1 的阶乘需要处理,这涉及到阶乘的解析延拓以及 Gamma 函数的理论,这里直接用结论:$(-1)! = \Gamma(0) = +\infty$,因此:

然后再用微积分基本定理,积分回来。注意到 $f(\infty) = \lim\limits_{t\rightarrow 0}\frac{1}{i!}t^{i}e^{-t} = 0$,因此:

可以看到泊松分布 $P(\lambda)$ 从 0 到 k 的求和,转化为了 $\Gamma$ 分布 $\Gamma(k+1, 1)$ 在 $[\lambda, +\infty)$ 的积分。

$\Gamma$ 分布
随机变量 X 服从参数为 $\alpha$ 何 $\beta$ 的 $\Gamma$ 分布,记为 $X \sim \Gamma(\alpha, \beta)$,其密度函数如下:

对比上面 $\Gamma$ 分布的密度函数,可以看到 $\frac{t^{k}e^{-t}}{\Gamma(k+1)}$ 是 $\alpha=k+1, \beta=1$ 的 $\Gamma$ 分布的密度函数。

总结

本文从二项分布 $B(n, p)$ 中如何求 $P(X \leq k)$ 出发,首先通过例子了解了対和式逐项求导积分的处理方法,通过这种方法,我们将二项分布上的和式 $P(X\leq k)$ 最终推导为了 Beta 分布上的积分,建立了二项分布和贝塔分布的关系。然后我们用完全相同的方法,得到了泊松分布上的和式 $P(X\leq k)$ 最终转化为了 $\Gamma$ 分布上的积分,建立了泊松分布和伽马分布的关系。推导过程中涉及到微积分基本定理、组合恒等式、阶乘的解析延拓,Gamma函数与Gamma分布、Beta函数与Beta分布等等,都是非常经典的理论。


Share