一元函数的单调性、凸性与单峰性

  |  

摘要: 一元函数的单调性、极值、凸性

【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:潮汐朝夕
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


本文介绍一元连续函数的单调性、凸性、极值相关的概念以及主要定理。这些是二分算法的基础。

在单调性、极值、凸性的定义中,并没有假定 $f$ 连续。当 $f$ 满足不同的连续、可导性条件时,单调性、极值、凸性会有不同的性质和判定方式。

单调性

下面是闭区间 $[a, b]$ 上的连续函数 $f(x)$ 具有单调性、严格单调性的性质和判定。

下面的定理均以单调递增描述,单调递减的情况类似。

定理1(单调递增的充要条件)

设函数 $f(x)$ 在 $[a, b]$ 连续,在 $(a, b)$ 可导,则 $f(x)$ 在 $[a, b]$ 上单调递增的充要条件是 $f’(x) \geq 0$ 在 $(a, b)$ 成立。


证明

必要性:

因为 $f$ 在 $[a, b]$ 递增,$\forall x \in (a, b)$,对能使得 $x + h \in (a, b)$ 的一切 $h$,不论 $h$ 的正负,总有:

令 $h \rightarrow 0$,因为 $f$ 在 $x$ 可导,所以:

充分性:

因为在 $(a, b)$ 上 $f’’(x) \geq 0$,对 $\forall x_{1}, x_{2} \in [a, b]$ 且 $x_{1} < x_{2}$,由 Lagrange 中值定理,有:

其中 $\xi \in (x_{1}, x_{2}) \subset (a, b)$

所以 $f’(\xi) \geq 0$,所以 $f(x_{2}) \geq f(x_{1})$

$\Box$

定理2(严格单调递增的充分条件)

设函数 $f(x)$ 在 $[a, b]$ 连续,在 $(a, b)$ 可导,若 $f(x) > 0$ 在 $(a, b)$ 成立,则 $f(x)$ 在 $[a, b]$ 严格单调递增


证明过程与定理1的充分性类似。但注意,这里逆命题不成立,例如 $f(x) = x^{3}$。

定理3(严格单调递增的充分条件)

设函数 $f(x)$ 在 $[a, b]$ 连续,在 $(a, b)$ 内除了有限个点之外,有正的导数,则 $f(x)$ 在 $[a, b]$ 严格单调递增


证明

设除点 $x_{1} < x_{2} < \cdots < x_{n} \in (a, b)$ 外,$f’(x) > 0$。即:

$f(x)$ 在 $[a, x_{1}], [x_{1}, x_{2}], \cdots, [x_{n}, b]$ 上连续,在 $(a, x_{1}), (x_{1}, x_{2}), \cdots, (x_{n}, b)$ 上 $f’(x) > 0$。

所以 $f(x)$ 在 $[a, x_{1}], [x_{1}, x_{2}], \cdots, [x_{n}, b]$ 上均严格递增,所以 $f(x)$ 在 $[a, b]$ 上严格单调递增。

$\Box$

定理4(严格单调递增的充要条件)

设函数 $f(x)$ 在 $[a, b]$ 连续,在 $(a, b)$ 可导,则 $f(x)$ 在 $[a, b]$ 上严格单调递增的充要条件是:

(1) $x \in (a, b)$ 时,$f’(x) \geq 0$。
(2) 在 $(a, b)$ 的任何开子区间内 $f’(x) \neq 0$。


证明

必要性

由定理1,(1) 是必要的。下面用反证法证明 (2) 的必要性。

假设 (2) 不被满足,即存在一个被 $(a, b)$ 包含的开区间,其内部 $f’ = 0$,那么在此开区间内 $f$ 为一个常数,与 $f$ 严格单调递增矛盾。

充分性

因为 $f’(x) \geq 0$,所以 $f$ 在 $[a, b]$ 单调递增。

对于 $\forall x_{1}, x_{2} \in [a, b]$ 且 $x_{1} < x_{2}$,若 $f(x_{1}) = f(x_{2})$,则对于 $\forall x \in [x_{1}, x_{2}]$,有 $f(x_{1}) = f(x) = f(x_{2})$。

所以 $x \in (x_{1}, x_{2})$ 时,$f’ = 0$,与 (2) 矛盾。所以 $f(x_{1}) < f(x_{2})$,所以 $f$ 在 $[a, b]$ 严格单调递增。

$\Box$

极值

下面是闭区间 $[a, b]$ 上的连续函数 $f(x)$,$f(x_{0})$ 为极值的判定方法(极值的充分条件)。

以下内容均以极大值描述,极小值的情况类似。

极值的定义

设 $f: [a, b] \rightarrow \mathbb{R}$,如果对 $x_{0} \in (a, b)$,$\exists \delta > 0$,使得 $\Delta = (x_{0} - \delta, x_{0} + \delta) \subset [a, b]$,且当 $x \in \Delta$ 时,$f(x_{0}) \geq f(x)$。则称 $f(x_{0})$ 是 $f$ 在 $[a, b]$ 上一个极大值,$x_{0}$ 为 $f$ 的一个极大值点

将 $f(x_{0})\geq f(x)$ 改为 $f(x_{0}) > f(x)$ 则为严格极大值。极值点只能在 $[a, b]$ 的内点上定义,这是一个局部概念

驻点、可微函数极值的必要条件

费马驻点定理(Fermat, 17世纪)

若函数 $f(x)$ 在极值点 $x_{0} \in (a, b)$ 处可导,则 $f’(x_{0}) = 0$。


证明

设 $f(x_{0})$ 为极大值,由极大值的定义,$\exists \delta > 0$,使得 $x \in (x_{0} - \delta, x_{0} + \delta)$ 时,$f(x_{0}) \geq f(x)$。

因此:(1) $x_{0} - \delta < x < x_{0}$ 时:

(2) $x_{0} < x < x_{0} + \delta$ 时:

因为 $f’(x_{0})$ 存在,所以 $f’_{-}(x_{0}) = f’_{+}(x_{0})$,在上述(1)(2)两个公式中令 $x \rightarrow x_{0}^{-}$ 和 $x \rightarrow x_{0}^{+}$ 得 $f’_{-}(x_{0}) \geq 0$,$f’_{+}(x_{0}) \leq 0$。

所以 $f’(x_{0}) = 0$。

$\Box$

满足 $x_{0} \in (a, b)$ 且 $f’(x_{0}) = 0$ 的 $x_{0}$ 称为 $f$ 的一个驻点

定理5(局部可导,极值的充分条件)

设函数 $f$ 在 $[a, b]$ 连续,$x_{0} \in (a, b)$,若 $\exists \delta > 0$ 使得

在 $(x_{0} - \delta, x_{0})$ 内 $f’(x) > 0$,在 $(x_{0}, x_{0} + \delta)$ 内 $f’(x) < 0$,则 $f(x_{0})$ 时 $f$ 的一个严格极大值。


证明

由定理2,$f$ 在 $[x_{0} - \delta, x_{0}]$ 严格单调递增,在 $[x_{0}, x_{0} + \delta]$ 严格单调递减,即 $f(x_{0})$ 为 $f$ 的严格极大值。

$\Box$

这里注意逆命题不成立,有时候函数 $f$ 在它的某个极值点任意一侧都没有单调性,例如:

定理6(局部二阶可导,极值的充分条件)

设函数 $f$ 在 $[a, b]$ 连续,$x_{0} \in (a, b)$,$x_{0}$ 是 $f$ 的一个驻点,$f’’(x_{0})$ 存在,则:

$f’’(x_{0}) < 0$ 时,$f(x_{0})$ 为严格极大值。


证明

因为 $x_{0}$ 为 $f$ 的驻点,所以 $f’(x_{0}) = 0$。所以:

所以 $\exists \delta > 0$,使得 $0 < |x - x_{0}| < \delta$ 时:

所以 $x\in (x_{0}, x_{0}+\delta)$ 时,$f’(x) < 0$;$x \in (x_{0} - \delta, x_{0})$ 时,$f’(x) > 0$,由定理 5,$f(x_{0})$ 为 $f$ 的严格极大值。

$\Box$

$f’’(x_{0}) > 0’$ 则 $f(x_{0})$ 为严格极小值,但注意:$f’’(x_{0}) = 0$ 时,还需要其它条件才能判断。

凸性

凸性的定义

定义(一元函数的凸性)

设函数 $f$ 在区间 $I$ 上有定义,若 $\forall x_{1}, x_{2} \in I$,$x_{1} \neq x_{2}$,$\forall \lambda_{1}, \lambda_{2} > 0$ 且 $\lambda_{1} + \lambda_{2} = 1$,都有:

称 $f$ 为 $I$ 上的凸函数。若上述不等式的 $\leq$ 改为 $< $,则称为严格凸函数

定理7(Jensen不等式1)

设 $f$ 为 $I$ 上的凸函数,则 $\forall x_{1}, x_{2}, \cdots, x_{n} \in I$ 和 $\lambda_{1}, \lambda_{2}, \cdots, \lambda_{n} > 0$ 且 $\sum\limits_{i=1}\limits^{n}\lambda_{i}=1$,都有:

若 $f$ 在 $I$ 严格凸,当 $x_{1}, \cdots, x_{n}$ 不全相等时有 $f(\sum\limits_{i=1}\limits^{n}\lambda_{i}x_{i}) \leq \sum\limits_{i=1}\limits^{n}\lambda_{i}f(x_{i})$。


证明(数学归纳法)

$n=2$ 时,由凸性的定义,$f(\sum\limits_{i=1}\limits^{2}\lambda_{i}x_{i}) \leq \sum\limits_{i=1}\limits^{2}\lambda_{i}f(x_{i})$ 可以直接得到。

假设 $n=k$ 时成立 $f(\sum\limits_{i=1}\limits^{k}\lambda_{i}x_{i}) \leq \sum\limits_{i=1}\limits^{k}\lambda_{i}f(x_{i})$。下面考虑 $n = k + 1$ 的情况。

设 $x_{1}, \cdots, x_{k+1} \in I$,$\lambda_{1}, \cdots, \lambda_{k+1} > 0$ 且 $\sum\limits_{i=1}\limits^{k+1}\lambda_{i}=1$。

令 $\mu_{i} = \frac{\lambda_{i}}{1 - \lambda_{k+1}}$,则 $\mu_{i} > 0$ 且 $\sum\limits_{i=1}\limits^{k}\mu_{i} = 1$,且 $\sum\limits_{i=1}\limits^{k}\mu_{i}x_{i} \in I$。所以:

$\Box$

定理8(Jensen不等式2)

设 $f$ 在 $I$ 上是凸函数,则 $\forall x_{1}, x_{2}, \cdots, x_{n} \in I$ 和 $\beta_{1}, \beta_{2}, \cdots, \beta_{n} > 0$ 有:


证明

令 $\lambda_{i} = \frac{\beta_{i}}{\sum\limits_{i=1}\limits^{n}\beta_{i}}$,由定理7 可得。

$\Box$

定理9(凸函数的充要条件)

$f$ 在 $I$ 上为凸函数,当且仅当 $\forall x_{1}, x_{2} \in I$ 以及 $x \in (x_{1}, x_{2})$ 有:

若严格凸,则不等号严格。


证明

必要性:

$x = \frac{x_{2} - x}{x_{2} - x_{1}}x_{1} + \frac{x - x_{1}}{x_{2} - x_{1}}x_{2}$ 是恒等式。

$x\in (x_{1}, x_{2})$ 时,$\lambda_{1} = \frac{x_{2} - x}{x_{2} - x_{1}} > 0$,$\lambda_{2} = \frac{x - x_{1}}{x_{2} - x_{1}} > 0$,且 $\lambda_{1} + \lambda_{2} = 1$,由凸性的定义:

另一方面 $f(x) = \lambda_{1}f(x) + \lambda_{1}f(x)$,代入以上不等式,得到:

整理后即得:

另一方面,我们有不等式:若 $b > 0, d > 0$,且 $\frac{a}{b} \leq \frac{c}{d}$,则 $\frac{a}{b} \leq \frac{a + c}{b + d} \leq \frac{c}{d}$。

令 $a = f(x) - f(x_{1}), c = f(x_{2}) - f(x)$,$b = x - x_{1}, d = x_{2} - x$ 代入上式,即得最终不等式。

$\Box$

该定理有明显的几何意义,即 $k_{P_{1}P} \leq k_{P_{1}P_{2}} \leq k_{PP_{2}}$:

定理10(可导,凸函数的充要条件)

$f$ 在 $[a, b]$ 上连续,$(a, b)$ 可导,则 $f$ 在 $[a, b]$ 上为凸函数的一个充分必要条件为:$f’(x)$ 在 $(a, b)$ 单调递增。


证明

必要性:

设 $(x_{1}, x_{2}) \subset (a, b)$,$x_{1} < x < x’ < x_{2}$,由定理9,有:

令 $x \rightarrow x_{1}^{+}$,$x’ \rightarrow x_{2}^{-}$,得:

充分性:

因为 $f’$ 在 $(a, b)$ 单调递增。$\forall x\in (x_{1}, x_{2})$,有 Lagrange 中值定理,$\exists \xi \in (x_{1}, x), \eta \in (x, x_{2})$ 使得:

因为 $\xi < x < \eta$,所以 $f’(\xi) \leq f’(\eta)$,所以:

由定理9,$f(x)$ 在 $[a, b]$ 为凸函数。

定理11(二阶可导,凸函数的充要条件)

$f$ 在 $[a, b]$ 上连续,$(a, b)$ 上二阶可导,则 $f$ 在 $[a, b]$ 上为凸函数的充要条件为 $f’’ \geq 0$ 在 $(a, b)$ 成立。

如果条件增加 $(a, b)$ 的任意开子区间内 $f’’$ 不恒等于 0,则为 $f$ 严格凸的充要条件。


凸的结论由定理1和定理10可得。

严格凸的结论由定理4和定理10可得。

单峰性

以下讨论均围绕单峰函数,类似地可以讨论单谷函数。

单峰函数是指所考虑的区间中只有一个严格的局部极大值(峰值)的函数。简单理解的话,可以认为 $f(x)$ 在区间 $[a, b]$ 上只有唯一的最大值点 $c$,$f$ 在 $[a, c]$ 单调递增,在 $[c, b]$ 单调递减,则 $f$ 在 $[a, b]$ 上为单峰函数。其一般定义如下。

单峰性的定义

设 $D$ 表示表示一个实数集合(例如闭区间、开区间、区间的并、数列等),设 $f(x)$ 是定义在 $D$ 上的实值函数,如果存在 $x_{0} \in D$,使得 $\forall x_{1}, x_{2} \in D$:

  • 当 $x_{1} < x_{2} \leq x_{0}$ 时,有 $f(x_{1}) \leq f(x_{2})$
  • 当 $x_{0} \leq x_{1} < x_{2}$ 时,有 $f(x_{1}) \geq f(x_{2})$

称 $f(x)$ 是定义在 $D$ 上的单峰函数,$x_{0}$ 称为峰值点

单峰函数的性质

性质1

单调函数是单峰函数。

性质2

单峰函数在其定义域的任何子集上,仍为单峰函数。

性质3

若 $f(x)$ 为单峰函数,那么 $l + kf(x)$,当 $k > 0$ 时仍为单峰函数,$k < 0$ 时为单谷函数。且峰谷值点不变。

性质4(凸函数与单峰函数的关系)

如果 $f(x)$ 为闭区间 $D$ 上的凹(凸)函数,那么 $f(x)$ 必为 $D$ 上的单峰函数(单谷函数)。


证明思路:假设不是单峰,而是双峰或多峰,那么两个峰的中间的凹凸性一定发生改变。

性质5(三分算法的正确性)

$f(x)$ 为 $[a, b]$ 上的单峰函数,$x_{0}$ 为峰值点,则 $\forall a \leq x_{1} < x_{2} \leq b$ 有:

若 $f(x_{1}) \geq f(x_{2})$,则 $x_{0}$ 在 $[a, x_{2}]$ 上;若 $f(x_{1}) \leq f(x_{2})$,则 $x_{0}$ 在 $[x_{1}, a]$ 上。


Share