移动互联网欺诈模型

  |  

摘要: 用反应扩散方程对欺诈者数量和欺诈利润进行建模

【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:潮汐朝夕
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


最近在一篇电商反欺诈的报告 工信部2019年移动数字金融与电商反欺诈白皮书 中看到一个用反应扩散方程对欺诈者数量和欺诈收益进行建模的方法,感觉耳目一新,分享给各位。


https://max.book118.com/html/2018/0520/167593594.shtm

准备知识: 反应扩散方程

移动互联网欺诈行为定义

在进行服务的过程中,当一方采取虚假信息或者其他不正当手段欺骗、误导另一方,使得其在违背其真实意图的情况下完成业务或服务,就构成了欺诈行为。

以上定义中的【一方】、【另一方】可以是平台业务生态中的各个利益相关方,因此数字金融及电子商务中的欺诈行为中,各方都有可能成为受害者,而不是说只有平台才是受害者。

反应-扩散模型的思想

如果将欺诈看做一种经济行为,它通常可以带来超额利润,从而引起更多参与者的加入。

这样的话,可以将【经济行为 -> 超额利润 -> 更多参加者】 这个过程视为一种 【反应-扩散模型】。

反应扩散模型是同时考虑扩散、迁移和增长的模型。如下图

反欺诈扩散模型示例

在欺诈者与受害者(商家和用户都可能成为欺诈者)的行为模式影响下,通过移动互联网服务为平台,与外部环境相互作用,形成欺诈者与受害者的反应扩散模式,最终使得移动互联网反欺诈行为经过作用与反馈的不断迭代,形成较为成熟的模式。

欺诈模式形成的过程中,欺诈者、受害者都在不断地迁移、发展和退出。同时,反应扩散的过程使得在移动互联网的“状态空间”中连续变化:个体(欺诈行为)随机迁移并以相同的概率向各个方向(移动互联网的各个业务)。在这个过程中反应是指欺诈者和被欺诈这之间的相互作用,有两方面

  1. 在【欺诈者数量 S,欺诈所获收益 I】的条件下,新的欺诈者被激发出来
  2. 由于某种欺诈行为带来的回报而使其它欺诈人员参与并造成更激烈的竞争和更强的监管,使得欺诈代价提升 $G(S, I)$

S 和 I 是互相耦合的:

  • 欺诈者数量会影响欺诈的收益
  • 欺诈的收益优惠激发新的欺诈者

与任何经济行为一样,S 和 I 都会随时间不断扩散: 在不同领域中,欺诈者和收益都将沿着梯度的方向进行扩散,向着收益更大的方向上演化。

在均匀的初始条件下,经过长时间的演化,最终通常会呈现出某些宏观的空间特性(例如在电子商务和数字金融领域,欺诈发生的频率明显增高)。

反应-扩散模型的推导

对于一般的互联网欺诈,其反应-扩散模型可以写为

其中 $D_{1}, D_{2}$ 是扩散系数。

由于欺诈者数量 S 和欺诈收益 I 之间耦合关系 ($F(S, I), G(S, I)$)很强,因此将其定量描述为

其中 $\alpha, \beta, p, q$ 为变量的系数,其中欺诈者数量和欺诈收益之间用 Logistic 方程拟合

在以上欺诈的数学模型中,虽然欺诈收益的提升会吸引更多的欺诈者进入该行业,但是欺诈者的增加会使得“竞争”更加激烈,从而降低欺诈带来的收益。

模型的边界条件为:

代入近几年我国的数据拟合参数

有了以上的反应-扩散模型,下面就根据我国电子商务、数字金融的市场规模以及我国近年来上述领域由于欺诈造成的损失统计值来插值计算上述几个系数。

首先根据提出此模型的工信部白皮书的各个合作单位(例如同盾、数美等)提供的数据,可以统计出可以账号的数量。

然后选取各年的几百组调研和实际案例,估算欺诈造成的损失。将数据整理后形成下表

时间 电子商务市场规模(万亿) 数字金融市场规模(万亿) 欺诈造成的损失(亿) 疑似欺诈者账号数量(万) 单账户欺诈造成年均的损失(万元)
2014 12.6 8.1 1032 330 3.13
2015 16.9 11.2 1642 412 3.98
2016 19.3 15.7 2411 534 4.51
2017 22.4 16.1 3072 723 4.24
2018 25.2 17.2 3513 1060 3.31

从表中数据可以看出,随着疑似欺诈账户的增加,使得欺诈的同行“竞争”更加激烈,并使得相关企业投入更多资源用于反欺诈,造成了欺诈的收益率降低,这也从侧面验证了本文所提出的欺诈数学模型的有效性。

根据上表数据对反应-扩散模型的参数进行拟合,可以得到

  • $\alpha = 0.002$
  • $\beta = 0.013$
  • $p = 0.15$
  • $q = 0.31$

预测后面几年的损失

基于拟合出的参数,如果维持当前现状,未来可能造成的损失预测如下:

年份 疑似欺诈者账号数量(万) 单账户欺诈造成年均的损失(万元) 欺诈造成的总损失(亿)
2019 1250 3.09 3870
2020 1310 3.93 5150
2021 1740 3.41 5940
2022 2300 3.08 7100

从统计结果来看,2018 年我国移动互联网欺诈造成的损失大约相当于我国当年 GDP 的 0.3%。但是,如果 GDP 保持在 6.5%的速度发展,则按上述预测,从 2019 年到 2022 年,互联网欺诈可能造成的损失占 GDP 的比例依次为

  • 2019: 0.4%
  • 2020: 0.5%
  • 2021: 0.55%
  • 2022: 0.61%

实际情况中还存在大量未被发现的欺诈账号欺诈行为

随着我国数字经济发展,新的业务和新的欺诈形式也会同时出现,因此实际损失可能比推算更大。


Share