Archive: 2021

机器学习离线系统中常用的工具代码

摘要: 机器学习离线 Pipeline 中的常用工具 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在互联网产品中,一个完整的机器学习的业务闭环中,一般涉及两个系统,一个在线系统,

发文统计

摘要: 统计本站每个月写的文章数量 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 月 年 发文 5 2020 28 6 2020 19 7 2020 19

Plotly可视化绘图

摘要: 一本 Plotly 可视化绘图的书 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 微信读书: Python数据分析: 基于Plotly的动态可视化绘图 基础 Plot

Python数据可视化-各种图表类型总览

摘要: 数据可视化常见图表,基于 Matplotlib、Seaborn、plotnine 三开个库 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 数据可视化基础 Matplo

Matplotlib-Cookbook

摘要: 《Python数据可视化编程实战》 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本书是一些基础,常用的Matplotlib知识,留着备查。 豆瓣链接: Python数据可

Matplotlib精进

摘要: 一本高级 Matplotlib 的书 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本书是一些更高级,也就是更不常用的Matplotlib知识:比如绘制几何图形、更细节的文

因子投资

摘要: 《因子投资》这本书。 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本书是关于因子投资的,内容非常全面。比较偏理论,有A股的实证研究,值得学习。本书没有代码,不过由于书里都

预测:方法与实践

摘要: 《预测:方法与实践》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本书是《预测: 方法与实践》,2018年4月的第二版,主要变化如下: 最大的变化是更加聚焦时间序列预测。也就是说,我们不

数据密集型应用系统设计

摘要: 经典书《数据密集型应用系统设计》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 《数据密集型应用系统设计》 数据系统的基石 可靠性、可扩展性、可

C++并发编程

摘要: 《C++ Concurrency in Action》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings Cpp_Concurrency_In_Action-中文

最优化的数学基础

摘要: 最优化数学基础:线性代数、计算数学、概率 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 最优化是机器学习的一个重要的基础知识。理论可以参考 最优化-建模,算法与理论 ,计算

智能风控典藏版合辑-2021

摘要: 一份 2021 年 DataFunTakl 的智能风控合集 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 智能风控典藏版合集 DataFun

艰难的选择

摘要: 记录一些研报和行业信息的平台,顺便写点随笔。 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 我们大多数人大学以后的人生轨迹是,在大学里学习四年,之后可能会继续上三年研究生,

金融时间序列经典书

摘要: 《金融时间序列分析》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings Analysis_of_Financial_Time_Series_3rd 金融时间

时间序列分析经典书

摘要: 《时间序列分析与应用》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 时间:2011(中文版) 作者:Jonathan D.Cryer 代码:R 语言安装 TSA 包

图论算法理论,实现与应用

摘要: 《图论算法理论,实现与应用》 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 图论算法理论-实现及应用

编程中的组合数学

摘要: 本文介绍一本编程中的组合数学的书 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 程序设计中的组合数学

最优化-建模,算法与理论

摘要: 《最优化:建模,算法与理论》 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本书是 2020 年出的关于最优化的理论与算法方面的书,作者是中国人。优化计算这块可以参考 数值

数值计算经典算法

摘要: 一本计算数学非常经典的书,有点大部头 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings Numerical.Recipes.3rd.Edition

leetcode题目汇总-栈

摘要: 力扣上的栈的问题汇总 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本文总结一下力扣上 2000 题以内的关于栈的 73 道题。 栈是一种最基础的数据结构,本身是比较简单的,而且没什么变化

LeetCode题目汇总-随机算法

摘要: LeetCode 随机算法题目汇总 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在文章 大数据应用中的概率算法与数据结构 中有提到一类海量数据处理的问题,并且分享了一本还

同事聚会-20211224

摘要: 同事聚会,闲聊 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 可之同事,20211224 @北京.国贸。

两本高级数据结构的英文书

摘要: 两本高级数据结构书 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本文给大家分想两本高级数据结构的书。LeetCode 主要是针对面试的算法刷题平台,在 LeetCode

大数据应用中的概率算法与数据结构

摘要: 介绍一本概率算法与数据结构的书 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 最近系统复习了一下概率的东西,主要是因为【概率面试题连载】里面遇到某些题吃瘪了,在查资料的时候

陌陌前同事聚会

摘要: 陌陌前同事,聚会合集 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 2021.12.20 很久以前@望京。 有同事跳槽了小红书,另外还有一位同事跳槽到了 Soul。

数据分析之图算法:基于Spark和Neo4j

摘要: 《Graph Algorithms Practical Examples in Apache Spark and Neo4j》 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings

供应链算法与业务

摘要: 供应链算法和业务思维导图,2021.12 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings

无监督学习总览

摘要: 《基于Python的无监督学习》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 最近的一本新书《基于Python的无监督学习》,还不错,主要内容如思维导图所示:

散点图与散点图矩阵

摘要: 本文是散点图与散点图矩阵的代码模板。 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 散点图散点图一般用于描述两个数量型变量之间的相关关系。 有了 x 和 y 两个变量的数据

皮尔逊相关系数

摘要: 皮尔逊相关系数 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 皮尔逊相关系数是一种反映两个变量之间线性相关程度强弱的统计量,绝对值越大,相关性越强。 关于两个变量间相关性的度量的评价

数据仓库中的各种表

摘要: 数据仓库中常听到的表是什么意思 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 宽表,窄表宽表是将多个维度的信息放在一张表中,通常是指业务主题相关的指标、维度、属性关联在一起

Numpy-API速查表

摘要: 本文记录 Numpy 的 API,使用时关键词搜索即可 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 参考资料: 文档: Numpy API Reference 本文的 pdf 版本:Nu

互信息

摘要: 互信息 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 互信息的定义对于两个随机变量 X 和 Y,如果其联合分布为 p(x, y),边缘分布为 p(x), p(y),则互信息定义为 I(X;

Scipy-API速查表

摘要: 本文记录 Scipy 的 API,使用时关键词搜索即可。 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings SciPy documentation 1 scipy.clus

相关系数矩阵热力图

摘要: 相关系数矩阵热力图的代码模板 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本文是相关系数热力图的代码模板。 pearson 相关系数衡量的是线性相关关系。若 r = 0,

两列数据的相关性和独立性的度量

摘要: 两列数据的相关性和独立性 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings $1 关联度量给定两个随机变量 X, Y,如何判断这两个随机变量是否相互独立。 首先我们看一下 X 与 Y 的

随机抽样与样本偏差

摘要: 随机抽样与样本偏差 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在大数据时代,看起来好像是由于算力提高,抽样的作用弱化了。但是实际上由于我们面对大数据的是数据质量不一,相关性各异的

分层抽样

摘要: 分层抽样 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 分层抽样的概念抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为

经典CNN模型-DenseNet手写笔记

摘要: 2018 年左右 DenseNet 学习笔记 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings DenseNet 相比 ResNet 可能影响力小一点,但也是计算机视觉中很重要

图片分类模型调参技巧

摘要: 2018 年左右,图片分类模型调参技巧论文学习笔记 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings Bag of Tricks 论文这是一篇 2018 年的论文,介绍了当年图

经典CNN模型-ResNet手写笔记

摘要: 2018 年左右 ResNet 学习笔记 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings ResNet 是计算机视觉中非常重要的一个 CNN 模型,2015 年被提出,后来陆

KL散度(相对熵)

摘要: KL散度 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings KL散度(相对熵)KL(Kullback-Leibler)散度是一种衡量分布间的相似性的指标,从信息论的角度看,KL散度是信息增益或相

字体文件

摘要: 本文是一些字体文件,需要的时候可以下载使用。 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 以下字体文件均为开源字体,不可免费商用的字体不碰。 中文字体(1) 站酷 站酷

用matplotlib的Animation画动图

摘要: 用 matplotlib 的 Animation 画动画的方法和例子 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 我们在使用 matplotlib 时,常用的是 pypl

秋天树叶

摘要: 秋天的黄树叶,照片集锦 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings

收尾事件盘点-2021

摘要: 2021 年年底的待办</div>【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 有道云笔记 Linux性能优化 DL with PyTorch SQL必知

小红书-给大家汇报一下吧

摘要: 2021 年小红书的一篇笔记 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 大家好呀,今天往回翻了一下,leetcode题目汇总的思维导图陆陆续续发了 26 张了,之后按计

概率DP的解析解

摘要: 选票盒问题和系列赛问题的解析解 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 这是概率面试题连载第 28 期,往期的内容整理在这篇文章里;或者看这个 github 仓库。 今天我们回炉两道之

AI工程体系

摘要: AI 算法工程师在工程方面会涉及到的一些问题 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings AI系统 业界方案 训练系统 推理系统 AB测试系统 迭代系统 标注系统 部署系统 业

数据分布特征的统计描述

摘要: 数据分布特征的统计描述 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本文简要梳理一下数据分布特征的统计描述,以及相应的 Python 代码。 主要涉及以下内容 集中趋势 众数