Archive: 2021/4

快速选择算法

背景快速选择算法是解决【从 N 个元素中选出前 K 个或第 K 个】这个问题的算法。这个问题是 topK 问题中比较简单的一类,稍微复杂一点的 topK 问题就需要用堆和值域二分等算法。关于 TopK 问题,可以参考这篇文章: topK问题分类汇总 快速选择算法是一种减治算法,通过 partition 将问题区间 [left, right] 划分为 [left, partition] 和 [par

领会领导意图

摘要: 如何领会领导的意图 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 日常的工作中,并不是手上的所有工作都要又快又好地完成的。 很多工作其实拖一拖没什么关系,但是必须保证质量

CMU数据库-基于C++17

摘要: 本文介绍一个数据库系统的好课。 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本课资料 https://15445.courses.cs.cmu.edu/fall2020/

Mining-of-Massive-Datasets

摘要: 本文介绍一本书《斯坦福数据挖掘教程》 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本书资料 主页: Mining of Massive Datasets Stanford

运行天数统计

摘要: 对 Hexo 网站增加运行天数的统计 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 将以下 js 代码放到网站的 footer 中。对于 hueman 主题框架,就是 theme/h

markdowm转pdf,Pandoc项目

摘要: 本文记录 Markdown 转 pdf 的方法 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings Markdown 是程序员平时编写各类材料和文章时最喜欢的工具,但将其作为文档

vmware-Ununtu无损扩容

摘要: 本文记录使用 gparted 给 vmware Ubuntu 虚拟机的磁盘扩容应该怎么操作。 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings $1 扩展虚拟机硬盘关机状态下找

《首席产品官1》 -- 产品人与产品团队

摘要: 关于产品团队,参考《首席产品官1》 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 产品经理与产品人产品经理的定义和产品人的层级互联网产品经理定义:在互联网公司中,专职对互联

百乐custom845-生漆

摘要: 百乐 845,生漆笔身,适合日用 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 百乐 custom 845,生漆笔杆,15号尖,18K双色尖。 2019 年全新入手价 27

中序遍历过程中通过引用维护前驱

相关算法参考 二叉查找树的中序遍历和前驱后继 783. 二叉搜索树节点最小距离给你一个二叉搜索树的根节点 root ,返回 树中任意两不同节点值之间的最小差值。 示例 1:输入:root = [4,2,6,1,3]输出:1示例 2:输入:root = [1,0,48,null,null,12,49]输出:1 提示:123树中节点数目在范围 [2, 100] 内0 <= N

最大子矩阵和

摘要: 最大子矩阵和问题,有两种处理二维情况的方式。 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在文章 最大子数组和的三种解法 中,我们详细拆解了最大子数组和这个问题,并且了解到这个问题有三种解

欺诈检测论文集合

摘要: 分享一个欺诈检测论文集合的仓库,有时间可以看一看 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 仓库地址 Awesome-Fraud-Detection-Research-

带大小限制的最大子数组/子矩阵和

摘要: 带大小限制的最大子矩阵和 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在文章 最大子数组和的三种解法 中,我们详细拆解了最大子数组和这个问题,并且了解到这个问题有三种解法,都非常主流,并且

监督学习的分类

输入特征空间为欧式空间 $\boldsymbol{X}$,维数为 d,对于二分类问题,输出空间为 $\boldsymbol{Y} (\forall y \in \boldsymbol{Y}, y \in \{-1, 1\})$ $\boldsymbol{x}$ 为输入特征空间的一个随机向量,$y$ 为输出空间中的一个随机变量。$P(\boldsymbol{x}, y)$ 为 $\boldsymbo

kdd-cup2021赛题

摘要: 2021 年 KDD 比赛的三道题,涉及时间序列、交通网络、图模型 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 赛题1 基于多数据集的时间序列异常检测 Multi-dat

概率图模型与反欺诈

摘要: 简要穿讲一下概率图模型以及在风控中的应用 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 概率图模型概率图模型结合概率论与图论,用图来表示与模型有关的变量的联合概率分布。如果把这里的变量视为实

金融反欺诈综述论文

摘要: 几篇金融反欺诈的综述论文 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 数据挖掘 West J, Bhattacharya M. 2016. Intelligent fin

KMeans的矢量量化应用

摘要: KMeans 的一个应用:矢量量化 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings K-Means聚类最重要的应用之一是非结构数据(图像,声音)上的矢量量化(VQ)。非结构化数据往往占用比较多

【情侣钢笔】凌美2000

摘要: 凌美金尖钢笔最经典的型号,有玻璃纤维和全钢两种笔身材质 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 凌美2000玻璃纤维笔杆和全钢笔杆。14K 金尖 玻璃纤维笔杆: E

用PCA对手写数字数据集降维

摘要: PCA 的一个应用:对手写数字数据集降维 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在 sklearn-特征工程-特征选择 中,有使用过手写数字数据集。 我们使用了各种方法对手写数据集进

水源BBS

摘要: 水源 BBS 的回忆 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 最近加入了一个交大系的创业公司,借此机会认识了还在学校的学弟,然后就突然想起来水源 BBS 校外访问不了

LR评分卡--开发流程

LR 模型开发参考流程 导入数据 数据洞察 数据预处理 重复值 缺失值 缺失值比例 $\leq 2%$ : 删数据/用均值填 缺失值比例 $\gt 20%$: 算法填充 异常值 业务理解: 年龄为 0/ 收入为负数等 箱线图 $3\sigma$ 法则 删除或与业务方联系 量纲, 数据分布 统一量纲,标准化后,数据的范围、大小会改变 为例业务方便,尽量保持数据原貌 先尝试不做统一量纲 样

sklearn-聚类

摘要: sklearn 聚类基础 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 无监督学习只需要特征矩阵 $\boldsymbol{X}$,不需要真实标签 $\boldsymbol{y}$。PCA

sklearn-逻辑回归

从线性回归到逻辑回归逻辑回归和线性回归在很多书中都是以线性模型为主题放在一起讲的,关于线性回归的基本理论以及 sklearn 中的线性回归,在 sklearn-线性回归 已经学习过。 多元线性回归的模型如下: z = \begin{bmatrix} \theta_{0} & \theta_{1} & \theta_{2} & \cdots & \theta_{n} \\ \end{bmatr

利用Python进行数据分析-聚合与分组

摘要: 《利用Python进行数据分析》数据的聚合与分组的笔记 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 对数据集分类形成若干组,并在每一组上应用一个聚合函数或转换函数。是数据分析 workfl

互联网广告风控团队的职位

摘要: 广告风控都做哪些事情 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 阿里妈妈我们是阿里妈妈风控团队,有流量质量和广告质量两大方向: 流量质量方向,核心职责是甄别价值千亿的商业流量中作弊、无

利用Python进行数据分析-可视化

摘要: 《利用Python进行数据分析》可视化部分笔记 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 帮助识别异常值,为建模提供想法 国建网络交互式可视化可能是最终目标 Python 有很多第三方

利用Python进行数据分析-连接、联合与重塑

数据可能分布在多个文件或数据库中,处理这种情况需要用到数据联合、连接以及重排列的相关工具。 分层索引分层索引:允许在一个轴向上拥有多个索引层级。提供了一种在低维中处理更高维度数据的方式。 123data = pd.Series(np.random.randn(9) ,index=[["a", "a", "a", "b", "b", "c", "c", "d", "d"

利用Python进行数据分析-数据清洗与准备

加载、清理、转换、重排 缺失值、重复值、字符串操作、数据转换 1. 缺失值数值型数据,Pandas 用浮点值 NaN(Not a Number) 表示缺失值,可以用 np.nan 得到。 Pandas 将缺失值称为 NA,这是采用了 R 原因的惯例,意思是 Not Avaliable。R 语言中,NA 是不存在的数据或存在但不可观察的数据(例如数据收集过程出问题)。 Python 內建 None

感兴趣的钢笔-2021

摘要: 2021 年感兴趣的一些钢笔,仅记录,以后很可能也不会买。 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 2020年研究过不少钢笔,不过钱有限只能随缘买一点,下面是研究过但是没有买的钢笔,括

git操作集锦

摘要: 本文整理 git 中常见的操作和小功能,持续更新 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 参考资料:沉浸式学git 问题解决命中系统保留文件名在 windows

分桶法

摘要: 本文总结了 leetcode 上的分桶法相关的题目 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本文总结了力扣上 2000 题以内的关于分桶的 14 道题。将场景相同的放到了一起,场景上主

围棋栏

摘要: 关于围棋 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 基本规则学习路线快乐吃子行棋术语棋形术语劫争术语布局体系序盘套路中盘战术官子收束

利用Python进行数据分析-Pandas的IO

数据载入、存储以及文件格式 输入输出类型:文本文件、硬盘上其它更高效的格式文件、数据库、网络资源。 1. 文本格式数据将表格型数据读取为 DataFrame 对象。解析函数如下 函数 描述 read_csv 从文件, URL或文件型对象读取分隔好的数据,逗号是默认分隔符 read_table 从文件, URL或文件型对象读取分隔好的数据,制表符(\t是默认分隔符) rea

情侣钢笔-三文堂ECO透明活塞

摘要: 三文堂透明活塞钢笔 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 三文堂ECO透明活塞,钢尖 透明: 2019 年 315 珊瑚桔: 2019 年 350

2021力扣杯春季赛团队赛

摘要: 2021.04 参加 Leetcode 春季赛,这次成绩很好,3200 多队进了前 50,拿到了奖品。 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本次团队赛我(力扣账号

力扣LCP37-最小矩形面积

摘要: LCP37,计算几何问题 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 今天我们来看一个比较难的计算几何题,力扣 LCP37,本题是2021力扣杯春季赛团队赛第5题。算法要点如下: 两条直

力扣LCP34-二叉树染色

摘要: LCP34,树形DP 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 今天我们来看一个树形DP的何题,力扣 LCP34,本题是2021力扣杯春季赛团队赛第2题。算法要点如下: 树形DP 二叉

开源栏

摘要: 开源项目 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 开源项目的链接是别人的,过一段时间后有些链接会失效,学习过的内容可以写点笔记。 项目 项目 备注 de

书籍栏

摘要: 本文记录书和专栏,持续更新。 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 多看阅读 豆瓣阅读 微信读书 京东读书 知乎书架 得到书架 极客时间 各个渠道见过的一些有

交大125周年

摘要: 交大 125 周年刷屏回忆 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings

个人财务KeyNotes

摘要: 个人财务 tips,在实践中学习 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 提升工作能力提高工资收入 合适的副业开源 健康的消费观念节流 适合自己的投资体系

【情侣钢笔】百利金M200和M400

摘要: 百利金经典款式 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 百利金M400白乌龟,14K金尖。2019 年二手 1100。 百利金M200透明示范,钢尖。2019 年二

xgboost入门-手写笔记

使用 XGBoost 的两种方式 直接用 XGBoost 自己的建模流程 XGBoost 中的 sklearn 的 API 集成算法 -> 提升法 -> GBDT GBDT 回归预测与 XGB 回归预测的对比 XGBoost 中与 GBDT 通用的参数 n_estimators subsample eta LR 和 GBDT 的对比 GBDT 的 3 个基本组成要素 一个能衡

OSS图床

摘要: 使用 OSS 图床 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings $1 开通 OSS 服务https://www.aliyun.com/product/oss/ 选择折扣套餐,购买

传统金融行业六大分支和六大功能

摘要: 传统金融体系的六大分支与六大功能 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 传统金融体系的六大分支金融的内容可概括为货币的发行与回笼、存款的吸收与付出、贷款的发放与回收

工作汇报万能公式

摘要: 实践中很好用的工作汇报万能公式 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 结论 + 问题 + 原因 + 方案 + 规划 1. 结论总结工作进展和现阶段取得的成果。

资深风控研发工程师职位描述

摘要: 资深风控研发的职责与要求 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings JD1(滴滴金融)(1) 岗位职责 负责风控中台系统建设工作,包括需求把控、系统设计、功能开发等; 参与金融风控体系的构