Tag: 统计

数据直觉:至少一条数据偏离均值至少一倍标准差

摘要: 对任意数据集,至少有一条数据偏离均值至少一倍标准差 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在上一篇文章 数据直觉:任意数据集都很难有偏离均值多倍标准差的数据 中,我们简要介绍了数据集

数据直觉:任意数据集都很难有偏离均值多倍标准差的数据

摘要: 对任意数据集,很难有偏离均值多倍标准差的数据 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 新拿到一份业务数据,在分析这份数据的时候,我们往往从均值和标准差入手。本文我们推导均值和标准差的两

概率方法的威力:由数学期望的性质推导出不等式

摘要: 概率方法在不等式证明中的应用 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 各位好,今天我们继续看一个概率方法在证明不等式时的威力,整体上的方法与 一个微分不等式,概率方法的威力 中类似,只

随机数的可信性:事前理论论证,事中算法流程,事后统计验证

摘要: 随机数的可信性。参考:计算机程序设计艺术 第三章 【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:潮汐朝夕我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 大老板面临的随机公平性问题 最近新晋网红周鸿祎在各短视频平台上高调卖他9

考研概率论与数理统计常见方法与公式

摘要: 考研概率论公式集锦 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 古典概型 密度函数 分布函数 $X$ 为连续型随机变量与分布函数 $F(x)$ 连续的关系 伯努利试验 正态分布与

数理统计学简史

摘要: 《数理统计学简史》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 数理统计学简史 作者:陈希孺 《数理统计学简史》 早期概率论——从萌芽到《

参数估计与假设检验基础

摘要: 参数估计与假设检验基础 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 用假设检验解决决策问题收集数据 -> 数据分析 -> 建立一个统计模型 -> 验证模型的拟合

概率论最基础的内容

摘要: 概率率最基础的内容,常见的分布 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 现实世界的不确定性是普遍存在的,要描述不确定现象的规律,需要用到概率论所提供的理论和方法。 当不能获得总

皮尔逊相关系数

摘要: 皮尔逊相关系数 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 皮尔逊相关系数是一种反映两个变量之间线性相关程度强弱的统计量,绝对值越大,相关性越强。 关于两个变量间相关性的度量的评价

互信息

摘要: 互信息 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 互信息的定义对于两个随机变量 X 和 Y,如果其联合分布为 p(x, y),边缘分布为 p(x), p(y),则互信息定义为 I(X;

两列数据的相关性和独立性的度量

摘要: 两列数据的相关性和独立性 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings $1 关联度量给定两个随机变量 X, Y,如何判断这两个随机变量是否相互独立。 首先我们看一下 X 与 Y 的

随机抽样与样本偏差

摘要: 随机抽样与样本偏差 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在大数据时代,看起来好像是由于算力提高,抽样的作用弱化了。但是实际上由于我们面对大数据的是数据质量不一,相关性各异的

分层抽样

摘要: 分层抽样 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 分层抽样的概念抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为

KL散度(相对熵)

摘要: KL散度 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings KL散度(相对熵)KL(Kullback-Leibler)散度是一种衡量分布间的相似性的指标,从信息论的角度看,KL散度是信息增益或相

数据分布特征的统计描述

摘要: 数据分布特征的统计描述 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本文简要梳理一下数据分布特征的统计描述,以及相应的 Python 代码。 主要涉及以下内容 集中趋势 众数

贝叶斯思维

摘要: 《贝叶斯思维》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 贝叶斯思维 第二版 第二版的 Jupyter Notebook 代码: https://github.com/Alle

程序员的数学-概率统计

摘要: 《程序员的数学-概率统计》书籍介绍 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在实际应用中,我们希望灵活运用概率统计胸有成竹地处理相关问题,而不是凭直觉或者模糊概念猜测。这除了需要了解基

统计思维(第二版)

摘要: 《统计思维》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 统计思维(第2版) 知乎电子书链接 代码: https://github.com/AllenDowney/ThinkSt