智能风控近期书单

  |  

摘要: 2022年1月份左右智能风控书单

【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:潮汐朝夕
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


1. 智能风控与反欺诈:体系、算法与实践

  • 作者: 蔡主希
  • 时间: 2021

互联网金融与风险管理

  • 互联网金融的发展和现状
  • 风险管理类型划分
    • 欺诈风险
    • 信用风险
  • 风险管理的重要性
    • 风险评估
    • 差异化定价
    • 整体利润最优

传统风险管理体系

  • 人工审核
    • 纸质材料评估
    • 电话回访
    • 线下走访尽调
  • 专家模型
    • 业务规则库
    • 专家调查权重法
    • 熵权法
  • 评分卡模型
    • 目标定义
    • 样本选取
    • 变量分箱
    • 变量筛选
    • 模型建立
    • 模型评估
    • 模型应用
  • 传统方法的问题和挑战

智能风控模型体系

  • 大数据平台
    • 原始数据清洗
    • 数据仓库管理
    • 数据标签应用
  • 决策引擎
    • 规则配置
    • 模型部署
    • 冠军挑战者
    • 版本和权限管理
  • 智能反欺诈模型
    • 无监督学习
    • 图计算
  • 智能信用风险模型
    • 专家模型
    • 逻辑回归
    • 决策树
    • 集成树
    • 深度神经网络
    • 循环神经网络
  • 智能模型带来的提升
    • 数据广度和深度
    • 模型快速迭代和主动学习
    • 线上自动决策
  • 统计学与机器学习

风控大数据体系

  • 数据源类型
    • 征信报告
    • 消费能力
    • 资产状况
    • 基本信息
    • 黑名单
    • 多头借贷
    • 运营商
    • 地理位置
    • 设备属性
    • 操作行为
  • 特征工程方法
    • 统计量
    • 离散化
    • 时间周期趋势
    • 交叉项
    • 隐性特征
    • 用户画像
  • 数据测试与应用
    • 联合建模机制
    • 数据质量评估
    • 线上应用
  • 数据安全合规

智能风控中的常用算法

  • 有监督学习
    • 逻辑回归
    • 决策树
    • 随机森林
    • 度提升决策树
  • 无监督学习
    • 立森林
  • 深度学习
    • 深度神经网络
    • 循环神经网络
    • 词嵌入
    • 编码器
    • 移学习
  • 图计算
    • 社区发现
    • 标签传播
    • 图嵌入
  • 强化学习

智能模型训练流程

  • 数据清洗
    • 缺失值处理
    • 异常值处理
    • 重复值处理
    • 致性检验
    • 效性检验
  • 特征工程和特征筛选
    • 探索性数据分析
    • 稳定性
    • 重要性
    • 关性
    • 释性
  • 模型训练
  • 模型部署
  • 监控预警

反欺诈案例

  • 案例背景
  • 原始数据介绍
  • 探索性数据分析
    • 交易笔数
    • 交易时间
    • 交易类型
    • 易IP地址
  • 特征工程
    • 特征加工
    • 特征筛选
    • 特征分组
  • 模型训练
  • 模型评估
  • 案例优化

个人信贷风控案例

  • 案例背景
  • 原始数据介绍
  • 特征工程
  • 探索性数据分析
  • 模型训练
    • 逻辑回归
    • XGBoost
    • Wide&Deep
  • 模型评估
  • 模型应用
  • 案例优化

企业信贷风控案例

  • 银行POS贷
    • 案例背景
    • 原始数据介绍
    • 特征工程
    • 型训练
    • 型应用
  • 汽车金融CP评级
    • 案例背景
    • 原始数据&特征工程
    • 模型训练
    • 型评估
  • 案例优化

智能风控能力对外输出

  • 对外输出的意义
    • 内部能力“走出去”
    • 外部资源“引进来”
  • 头部玩家介绍
    • 互联网公司
    • 银行科技子公司
    • 第三方技术提供商
  • 合作模式及案例
    • SaaS 本地化模式
    • 对外输出案例
  • 金融科技创新与监管

2. 智能风控平台:架构、设计与实现

  • 作者: 郑江
  • 时间: 2021

智能风控基础

  • 认识智能风控
    • 什么是风控
      • 风控的定义和作用
      • 什么是大数据风控
      • 什么是智能风控
    • 风控的目标
      • 控风险
      • 稳增长
      • 保平衡
    • 风险的管理
      • 三道防线
      • 七大系统
      • 五大体系
      • 八大风险
  • 智能风控进化史
    • 智能风控1.0
    • 智能风控2.0
    • 智能风控3.0
  • 风控与业务场景的契合
    • 业务催生风险
      • 风险滋生
      • 风险爆发
      • 风险阻塞
      • 风险迭代
    • 业务场景下的风控
      • 电商风控
      • 支付风控
      • 信贷风控
      • 保险风控

智能风控平台

  • 智能风控业务
    • 智能信贷业务背景
      • 传统金融和互联网的碰撞
      • 智能信贷业务应用
    • 智能信贷风控业务背景
      • 信贷风控和金融科技的碰撞
      • 智能信贷风控业务应用
  • 智能风控平台架构
    • 智能风控业务架构
      • 信贷业务组织结构
      • 传统信贷风控业务架构
      • 智能风控业务架构组成
    • 智能风控系统功能架构
      • 智能风控系统功能架构组成
      • 数据平台
      • 接口管理系统
      • 分析引擎系统
      • 数据挖掘系统
      • 关系网络系统
      • 决策引擎系统
      • 指标管理系统
      • 风控服务管理系统
      • 贷中监控系统
      • 贷后管理系统
      • 贷后催收系统
      • 智能语音机器人
      • 风险管理系统
      • 风险报表系统
      • 平台管理系统
    • 智能风控系统技术架构
      • 访问层
      • 展现层
      • 系统层
      • 大数据平台
    • 智能风控平台业务、功能、技术架构的区别

智能风控平台设计

  • 智能风控平台核心系统
    • 决策引擎系统
      • 决策引擎系统的定义
      • 规则
      • 模型
      • 评分卡
      • 表达式
      • 模型监控
      • 决策流管理
      • 风控报告
      • 风险审核
      • 通用功能
    • 指标管理系统
      • 指标管理系统的定义
      • 指标列表
      • 指标配置
    • 接口管理系统
      • 口管理系统的定义
      • IP管理
      • API管理
      • 码值管理
      • 自动测试
      • 文档管理
      • 流量管理
      • 监控预警
    • 风险管理系统
      • 风险管理系统的定义
      • 名单管理
      • 标签管理
      • 自动检测
      • 风险画像
    • 核心系统运作方式
  • 智能风控平台次核心系统
    • 贷中监控系统
      • 贷中监控系统的定义
      • 自动监控
      • 风险预警
      • 监控统计
    • 贷后管理系统
      • 贷后管理系统的定义
      • 贷后风险管理
      • 资产风险管理
      • 贷后流程管理
      • 贷后任务管理
    • 平台管理系统
      • 平台管理系统的定义
      • 角色管理
      • 权限管理
      • 机构管理
      • 用户管理
      • 日志管理

3. 智能风控:评分卡建模原理、方法与风控策略构建

  • 时间: 2021
  • 作者: 张伟

评分卡建模理论基础

  • 评分卡建模常见面试问
  • 关于模型的系统性理解
  • 与建模密切相关的4个领域
    • 机器学习
    • 数据挖掘
    • 数据分析
    • 统计分析
    • 四者之间的联系与区别
  • 评分模型与评分卡模型
    • 评分模型和评分卡模型的定义
    • 评分卡模型的分类
    • 评分卡模型的适用性
    • 评分卡模型的价值
    • 评分卡模型的应用
  • 评分卡建模全流程
  • 对评分卡模型的评价

零售信贷业务基础和风险管理

  • 银行零售信贷产品的产品特征和业务流程
    • 个人贷款
    • 信用卡
  • 信用与信用风险
    • 信用风险识别
    • 信用风险评估
    • 信用风险监测
    • 信用风险控制
    • 征信
  • 欺诈与欺诈风险
    • 欺诈风险的分类
    • 欺诈风险的防范
    • 欺诈风险与信用风险比较

业务需求理解

  • 业务需求理解概述
  • 明确拟解决问题和分析目标
  • 业务访谈的设计和实施
  • 整体分析方案设计

数据基础决定模型效果上限

  • 关于数据的系统性认识
    • 数据基本特征
    • 常见数据问题
  • 传统信贷业务数据
    • 贷款可用数据
    • 信用卡可用数据
  • 征信数据
    • 征信数据概述
    • 一代人行征信
    • 二代人行征信
    • 一、二代人行征信的差异及映射转换
    • 人行征信数据的使用
  • 内外部大数据
    • 大数据概述
    • 银行内部大数据
    • 银行外部大数据
  • 数据质量诊断
    • 数据质量诊断目的
    • 数据质量诊断方法
  • 业务数据分析
    • 业务数据分析目的
    • 业务数据分析方法

利用特征工程提取有效的风险特征

  • 特征工程概述
    • 特征与特征工程
    • 数据处理与特征工程流程
    • 特征工程的理论体系
    • 特征工程的抽象范式
  • 特征预处理与转换
    • 常见数据质量问题
    • 特征清洗与预处理
    • 特征编码
    • 特征转换
  • 特征提取与生成
    • 业务专家经验定义
    • 工程化自动化衍生
    • 表征学习
  • 特征评价、选择与降维
    • 特征评价
    • 特征选择与降维
  • 自动化特征工程技术与工具
    • 自动化特征工程概述
    • 自动化特征工程工具

评分卡模型设计

  • 模型设计概述
    • 模型设计的定义
    • 模型设计的工作内容
  • 排除规则与样本范围
    • 排除规则和样本范围的定义
    • 申请评分卡模型排除规则
    • 行为评分卡模型排除规则
    • 催收评分卡模型排除规则
  • 模型细分
  • 表现期定义与Vintage分析
    • 表现期定义
    • Vintage分析
  • 滚动率
    • 滚动率定义
    • 滚动率分析
    • 滚动率计算常见问题
  • 观察期的定义与选择
    • 观察期的定义
    • 观察期的选择
  • 模型设计汇总计数
    • 汇总计数定义
    • 汇总计数的特别说明
  • 建模方式和模型原型选择

评分卡模型开发

  • 模型开发概述
  • 样本分区
  • 样本抽样
  • 变量预筛选
  • 变量分箱
  • 变量再筛选
  • 变量转换WOE
  • 使用逻辑回归进行模型拟合
    • 多重共线性检验
    • 逻辑回归建模
    • 模型训练结果
  • 模型验证
    • 排序性
    • 区分能力
    • 稳定性
    • 分值集中度
    • 分值分布
    • 离散度
  • 评分标尺
  • 模型导出PMML并测试
  • 评分卡建模专用Python包
    • scorecardpy工具包
    • toad工具包
    • RiskModeler工具包
  • 评分卡建模实例
    • 使用scorecardpy进行评分卡建模
    • 使用toad进行评分卡建模
  • 评分卡建模常见问题

评分卡模型验证

  • 模型验证概述
    • 模型性能的影响因素
    • 模型质量的评价
    • 模型验证的目的
  • 模型性能的技术性评价指标
    • 分类模型
    • 回归模型
  • 模型验证方法
  • 模型全面独立验证体系
    • 模型全面独立验证与开发期验证
    • 模型全面独立验证的内容和范围
    • 模型全面独立验证的阶段划分

评分卡模型部署

  • 模型部署概述
  • 模型部署工作流程
  • 规则化部署方案
    • 在信贷业务系统流程中硬编码
    • 在独立通用决策引擎系统中部署
  • 标准化部署方案
    • 模型描述标准
    • 导出模型文件
    • 模型文件的解释执行
  • 模型部署常见问题

评分卡模型监控

  • 模型监控概述
  • 前端监控
    • 总体评分分布
    • 总体评分分布稳定性
    • 总体平均分及偏移
    • 总体分值集中度
    • 变量取值分布
    • 变量取值分布稳定性
    • 变量加权平均分和偏移
  • 后端监控
    • 总体评分风险表现
    • 总体评分区分能力指标
    • 总体评分排序性
    • 变量风险表现
    • 变量区分能力指标
  • 监控数据和特征
  • 监控服务运行

评分卡模型优化

  • 模型优化概述
  • 模型优化的触发条件
  • 模型性能下降原因
  • 判断是否需要优化
  • 确定模型优化方案
  • 优化调整对现有决策的影响
  • 对基于评分的决策进行调整

评分卡模型的拒绝推断

  • 什么是拒绝推断
    • 拒绝推断的过程
    • 拒绝推断的合理假设
    • 拒绝推断的本质
  • 为什么要做拒绝推断
  • 如何做拒绝推断
    • Fuzzy扩展法
    • 简单扩展法
    • 分段扩展法
    • 拒绝推断的其他方法
  • 拒绝推断应注意的问题

评分卡模型的可解释性

  • 模型可解释性
    • 什么是模型可解释性
    • 为什么模型需要可解释性
    • 模型可解释性分类
    • 模型可解释性算法
  • 评分卡模型可解释性
    • 全局可解释性
    • 局部可解释性
    • 业务特殊考虑
    • 基于PMML Scorecard的可解释性

评分卡模型的其他常见问题

  • 分值分布不均衡问题
  • 特定群体或局部分数段区分能力弱问题
  • 训练-测试-时间外评分分布差异
  • 训练-测试-时间外评分性能差异
  • 模型迭代漂移现象
  • 潜在建模作弊问题

从传统评分卡模型到高维机器学习模型

  • 传统评分卡模型和高维机器学习模型的结合
    • 技术和业务发展背景
    • 摒弃两种极端观点
    • 传统评分卡模型与高维机器学习模型的比较
    • 两种工具结合使用
  • 高维机器学习模型XGBoost
    • XGBoost算法原理
    • XGBoost包简介
    • 使用XGBoost包建立预测模型
  • 高维机器学习模型LightGBM
    • LightGBM算法原理
    • LightGBM包简介
    • 使用LightGBM包建立预测模型

基于评分的风控策略应用

  • 模型、规则、策略、政策
  • 基于评分的贷前自动化审批策略
    • 贷前审批环节需要解决的问题
    • 线上信贷业务流程和风控流程
    • 基于评分构建贷前审批策略
    • 贷前审批策略经济效益测算
  • 智能风控领域的更多策略

4. 智能风控:Python金融风险管理与评分卡建模

  • 作者: 梅子行
  • 时间: 2020

信用管理基础

  • 信用与管理
  • 风控术语解读
    • 信贷基础指标
    • 信贷风险指标
  • 企业信贷风控架构

评分卡

  • 评分卡概念
    • 适用客群
    • 用途
  • 建模流程
  • 模型设计
    • 业务问题转化
    • 账龄分析与时间窗口设计
    • 数据集切分
    • 样本选择
    • 采样与加权
  • 数据与变量解读

机器学习

  • 基本概念
    • 空间表征
    • 模型学习
    • 模型评价
  • 广义线性模型
    • 多元线性回归模型
    • 经验风险与结构风险
    • 极大似然估计
  • 逻辑回归
    • sigmoid函数
    • 最大似然估计
    • 多项逻辑回归学习
    • 标准化
  • 性能度量
    • 误差
    • 混淆矩阵与衍生指标
    • 不均衡模型评价
    • 业务评价
  • 上线部署与监控
    • 上线部署
    • 前端监控
    • 后端监控
  • 迭代与重构
    • 模型迭代
    • 模型重构
  • 辅助模型
    • XGBoost
    • 模型解释性
    • 因子分解机
  • 模型合并

用户分群

  • 辛普森悖论
  • 监督分群
    • 决策树原理
    • 决策树分群
    • 生成拒绝规则
  • 无监督分群
    • GMM原理
    • GMM分群
  • 用户画像与聚类分析
    • 数据分布可视化
    • K均值聚类
    • 均值漂移聚类
    • 层次聚类
    • t-SNE聚类
    • DBSCAN聚类
    • 方差分析

数据探索与特征工程

  • 探索性数据分析
    • 连续型变量
    • 离散型变量
    • 代码实现
  • 特征生成
    • 特征聚合
    • 特征组合
  • 特征变换
    • 卡方分箱
    • 聚类分箱
    • 分箱对比
    • 箱的调整
    • 两种特殊的调整方法
    • WOE映射

特征筛选与建模

  • 初步筛选
    • 缺失率
    • 信息量
    • 相关性
    • 代码实现
  • 逐步回归
    • F检验
    • 常见逐步回归策略
    • 检验标准
    • 代码实现
  • 稳定性
  • 负样本分布图
  • 评分卡案例

拒绝推断

  • 偏差产生的原因
  • 数据验证
  • 标签分裂
  • 数据推断
    • 硬截断法
    • 模糊展开法
    • 重新加权法
    • 外推法
    • 迭代再分类法

模型校准与决策

  • 模型校准的意义
  • 校准方法
    • 通用校准
    • 多模型校准
    • 错误分配
    • 权重还原
  • 决策与应用
    • 最优评分切分
    • 交换集分析
    • 人工干预

模型文档

  • 模型背景
  • 模型设计
    • 模型样本
    • 坏客户定义
  • 数据准备
    • 数据提取
    • 历史趋势聚合
    • 缺失值与极值处理
    • WOE处理
  • 变量筛选
    • 根据IV值进行初筛
    • 逐步回归分析
    • 模型调优
  • 最终模型
    • 模型变量
    • 模型表现
    • 模型分制转换
  • 表现追踪

5. 智能风控:原理、算法与工程实践

  • 作者: 梅子行
  • 时间: 2020

风控建模与规则挖掘

  • 信贷与风险
    • 信贷业务与互联网金融风控体系
    • 信贷风险与控制
  • 工业建模流程
    • 抽象业务
    • 定义标签
    • 样本选取
    • 特征工程与模型调优
    • 上线监控与评估报表
  • 规则挖掘方案

集成模型评分卡

  • 特征工程解析
    • 特征与模型
    • 信用模型的特征
  • 特征衍生方案
  • 离散处理
    • one-hot编码
    • WOE编码
  • 迭代特征筛选方案
  • 自动化调参
    • 自动化调参策略
    • 参数搜索方案
    • 调参框架搭建
  • 递归特征删除方案
  • 评分卡制作
    • 逻辑回归评分卡
    • 集成模型的评分映射
    • 针对业务改写评价函数

迁移学习与冷启动

  • 迁移学习基础
    • 应用场景
    • 概念介绍
  • 迁移学习方法论
    • 三类常见算法
    • 迁移的实现方法
  • 少量有标签样本的迁移方案
    • TrAdaBoost模型
    • 跨场景迁移模型
  • 无标签样本迁移之JDA
    • JDA模型
    • 模型应用
  • 无标签样本迁移之DTELM
    • ELM模型
    • DTELM模型
    • 模型应用
  • 迁移样本筛选方案
    • 背景介绍
    • 算法框架概览
    • 搭建融合框架

幸存者偏差

  • 幸存者偏差的含义
  • 增量学习
  • 生成对抗网络
    • GAN模型介绍
    • GAN与幸存者偏差
  • 高斯混合模型
    • GMM算法原理
    • GMM简单应用
    • GMM中的概率模型
    • GMM样本生成
  • 信息准则
    • 赤池信息准则
    • 贝叶斯信息准则
    • AIC与BIC比较

不均衡学习

  • 样本不均衡
  • 代价敏感加权方案
  • 插值过采样方案
    • SMOTE算法
    • 过采样算法实践
  • 半监督学习方案
    • 前提假设
    • S3VM
    • LP

异常检测

  • 离群点与欺诈检测
  • z-score检验
  • LOF异常检测法
    • 原理与算法流程
    • LOF样本清洗方案
  • IF异常检测法
    • 原理与算法流程
    • PreA模型与冷启动

模型优化

  • 多损失函数分段预测
    • 两种损失函数
    • 融合流程
  • 树模型特征衍生
    • GBDT离散化
    • 融合方案详解
    • 特征衍生细节
    • 案例
  • 时间序列建模
    • RNN
    • LSTM
    • 门控结构
    • LSTM行为评分卡案例
  • 高维稀疏数据建模
    • 算法原理
    • 算法应用
  • 模型融合
    • 模型融合基础
    • 模型筛选
    • 业务应用方案

知识图谱

  • 复杂网络基础
  • 中心度与相似性
  • 节点分类
    • 朴素节点分类
    • 邻节点加权投票
    • 一致性标签传播
  • 社区发现算法
    • 基础概念
    • Girvan-Newman算法
    • Louvain算法
    • 社区评估
  • 网络表示学习
    • 矩阵分解
    • 节点嵌入
  • 图卷积神经网络
    • 卷积神经网络
    • 傅里叶变换
    • 拉普拉斯算子
    • GCN中的图卷积

6. Python金融大数据风控建模实战:基于机器学习

  • 作者: 王青天
  • 时间: 2020

智能风控背景

  • 金融科技介绍
    • 金融科技的前世今生
    • 金融科技正深刻地改变和塑造着金融业态
    • 新兴科技不断强化金融科技的应用能力
    • 金融风险控制面临着 的挑战
    • 智能风控和评分卡
    • 评分卡模型的开发流程
  • 机器学习介绍
    • 机器学习的概念
    • 机器学习的分类
      • 有监督学习
      • 无监督学习
      • 强化学习
    • 机器学习与人工智能的关系
    • 机器学习与数学的关系
    • 机器学习与深度学习
  • 评分卡模型介绍
    • 申请评分卡
      • 数据获取
      • 好坏样本定义
      • 观察期与表现期确定
      • 样本分层
      • 数据清洗与预处理
      • 特征工程
      • 模型训练与优化
    • 行为评分卡
      • 数据获取
      • 时间窗口
      • 特征工程
    • 催收评分卡
      • 催收评分卡分类
      • 催收策略
    • 反欺诈模型
      • 欺诈风险与信用风险比较
      • 欺诈模型好坏样本定义
      • 欺诈主体分析
      • 反欺诈方法介绍

评分卡理论与实战

  • 数据清洗与预处理
    • 数据集成
    • 数据清洗
    • 探索性数据分析
    • Python代码实践
      • 数据集成
      • 数据清洗
      • 探索性数据分析
  • 变量编码方法
    • 无监督编码
      • One-hot编码
      • Dummy variable编码
      • Label编码
    • 有监督编码
      • WOE编码
      • WOE编码与One-hot编码比较
    • Python代码实践
      • One-hot编码
      • Dummy variable编码
      • Label编码
      • WOE编码
  • 变量分箱方法
    • 变量分箱流程
    • 优Chi-merge卡方分箱方法
    • Best-KS分箱方法
    • 优IV分箱方法
    • 基于树的 优分箱方法
    • Python代码实践
      • 优Chi-merge分箱
      • 优IV分箱
      • 基于树的分箱
  • 变量选择
    • 过滤法变量选择
    • 包装法变量选择
    • 嵌入法变量选择
    • Python代码实践
      • 过滤法变量选择
      • 包装法变量选择
      • 嵌入法变量选择
  • Logistic回归模型
    • Logistic回归模型原理
    • 过拟合与欠拟合
    • Python代码实践
  • 模型的评估指标
    • 正负样本的选择
    • 标准评估指标
    • 概率密度评估指标
    • 概率分布评估指标
    • Python代码实践
  • 分卡分数转化
    • 由概率到分数的转换
    • 变量的分值计算
    • 评分卡性能评估
    • Python代码实践
  • 模型在线监控
    • 稳定性监控
    • 单调性监控
    • 性能监控指标
    • Python代码实践

评分卡理论与实

  • 样本不均衡处理
    • 数据层下采样样本不均衡的处理方法
      • 随机下采样方法
      • 样本邻域选择的下采样方法
      • 样本邻域清理的下采样方法
      • Bagging集成的下采样方法
      • Boosting集成的下采样方法
    • 数据层上采样样本不均衡的处理方法
      • 随机上采样方法
      • SMOTE样本生成方法
      • Borderline-SMOTE样本生成方法
    • 算法层样本不均衡的处理方法
    • 模型评估层样本不均衡的处理方法
    • Python代码实践
      • 数据层下采样样本不均衡处理代码实现
      • 数据层上采样样本不均衡处理代码实现
  • 特征工程进阶
    • 数据层特征工程
    • 算法层特征工程
      • 基于树模型的特征生成
      • FM特征交叉
    • Python代码实践
      • 数据层特征工程代码实现
      • 算法层特征工程代码实现
  • 决策树模型
    • 决策树模型的原理
    • 决策树学习
    • 决策树与过拟合
    • Python代码实践
  • 神经网络模型
    • 神经元模型
    • 神经网络的网络结构
    • 神经网络的学习策略
    • Python代码实践
  • 支持向量机模型
    • 感知器模型
      • 感知器模型的原理
      • 感知器与支持向量机模型
    • 线性可分支持向量机
    • 线性支持向量机
    • 非线性支持向量机
    • 感知器相关模型比较
    • Python代码实践
      • 线性支持向量机模型代码实现
      • 非线性支持向量机模型代码实现
  • 集成学习
    • Bagging与Boosting对比
    • Random Forest模型原理
    • Adaboost模型原理
    • GBDT模型原理
    • Xgboost模型原理
    • Python代码实践
      • Random Forest模型
      • Adaboost模型
      • GBDT模型
      • Xgboost模型
  • 模型融合
    • Blending方法原理
    • Stacking方法原理
    • Python代码实践
      • Blending模型融合代码实现
      • Stacking模型融合代码实现

Lending Club数据

  • 完整的模型开发实现
    • 数据源介绍
    • 数据的获取与预处理
      • 数据准备
      • 好坏样本定义
      • 数据清洗与预处理
    • 特征工程
      • 简单的特征工程
      • 变量分箱与编码
      • 变量选择
    • 模型构建与评估
      • 模型构建与优化
      • 模型评估
    • 评分卡生成

Share