风控算法工程师技能

  |  

摘要: 风控算法工程师的相关技能

【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:算法题刷刷
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


(1) 数据分析

前期

  • 有什么 — 现有哪些数据 — 描述性统计
  • 对不对 — 数据的正确性校验 — 异常值发现
  • 怎么定 — 观察期和表现期如何确定 — 数据抽取

中期

  • 样本的合理性分析 — 样本不平衡,采样
  • 特征重要度分析 — 哪些特征可能会对模型有较大影响
  • 特征稳定度分析 — 线上模型衰减问题

后期

  • 模型性能评估 — BadCase分析
  • 业务性能评估 — 可视化,监控大盘,报表

通用技能点

  • Excel
  • Pandas
  • Numpy
  • Matplotlib/Seaborn
  • SQL/Hive
  • SparkSQL

(2) 机器学习

基础

  • LR
  • 树模型
  • 集成学习

进阶

  • GBDT + LR/FM
  • DNN
  • RNN/LSTM

高阶

  • 社群发现
  • 深度图模型

通用技能点

  • scikit-learn
  • XGBoost/LightGBM/CatBoost
  • SparkML
  • Tensorflow/PyTorch

(3) 工程化

  • 离线Pipeline
  • 模型调优
  • 实时模型部署
  • 非实时模型部署
  • 模型/特征回溯
  • 模型监控
  • 模型降级方案

通用技能点

  • Python
  • Shell
  • C++/Java
  • Scala
  • Sklearn2pmml/TFserving/TensorRT

Share