美国FICO评分系统与芝麻信用分

  |  

摘要: 比较老但是很经典的 FICO 评分系统,仅供参考

【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:算法题刷刷
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


FICO评分系统

FICO(费埃哲),是美国个人消费信用评估公司。美国人经常谈的得分,通常就是指 FICO 分数,类似中国的芝麻信用分。

FICO 评分系统算出的信用分数在 300 ~ 850 之间,分数越高,说明客户的信用风险越小。

FICO 评分模型中所关注的主要因素有五类,分别是客户的信用偿还历史、信用账户数、使用信用的年限、正在使用的信用类型、新开立的信用账户。

  • (1) 偿还历史

占比 35%,主要包括

<1> 各种信用账户的还款记录,零售账户,分期偿还贷款,金融公司账户,抵押贷款。

<2> 公开记录以及支票存款记录,主要包括破产记录,丧失抵押品赎回权记录,法律诉讼事件,留置权记录。

<3> 逾期偿还的具体情况:逾期天数,未偿还的金额,逾期还款发生次数和逾期发生时距现在的时间长度。

  • (2) 信用账户数

占比 30%

  • (3) 使用信用的年限

占比 15%

  • (4) 正在使用的信用类型

占比 10%,分析客户的信用卡账户,零售账户,分期付款账户,金融公司账户和抵押贷款账户的混合使用情况。

  • (5) 新开立的信用账户

占比 10%,在很短时间开立多个信用账户的客户具有更高的信用风险,尤其是哪些信用历史不长的人。主要包括新开里的信用账户数,新开里的信用账户账龄,目前的信用申请数量,贷款方查询客户信用的时间长度,最近的信用状况(新开立的信用账户及时还款,会在一段时间后提高 FICO 评分)

总结

FICO评分是 Fair Isaac 公司开发的信用评分系统,是目前美国应用得最广泛的一种。FICO评分系统得出的信用分数范围在300~850分之间,分数越高,说明客户的信用风险越小,它采集客户的人口统计学信息、历史贷款还款信息、历史金融交易信息、人民银行征信信息等,通过逻辑回归模型计算客户的还款能力,预测客户在未来一年违约的概率:

  1. 人口统计学信息:如客户年龄、家庭结构、住房情况、工作类别及时间等;

  2. 历史贷款还款信息:即过去6个月或12个月的付款方式、逾期次数等;

  3. 历史金融交易信息:即过去6个月或12个月的平均月交易笔数、金额等;

  4. 银行征信信息:如过去12个月中新开的账户总数、所有账户的总额度、账户是否逾期等。

以上这些信息都是 FICO 评分模型的入模变量,最终会通过逻辑回归输出最终分数。

对比芝麻信用分

芝麻信用分是以大数据分析技术为基础,采集多元化数据,包括传统的金融类交易、还款数据,第三方的非金融行为数据,互联网、移动网络和社交网络数据等,字段极多。考察个体的还款能力、还款意愿、欺诈可能性,稳定性等多个层面的评分,再把这些单个层面的评分得到最终的信用评分,做出合理、全面的信用评分。

两种评分的思路区别:

  • FICO 的入模变量很少,每个变量对目标的预测性和影响力都很高
  • 芝麻信用分的入模变量很多,且每个变量的预测性可能都很小。大量只有微小预测性的变量最终汇总成预测性很强的评分(Ensemble)。

Share