Category: 统计

数据直觉:至少一条数据偏离均值至少一倍标准差

摘要: 对任意数据集,至少有一条数据偏离均值至少一倍标准差 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在上一篇文章 数据直觉:任意数据集都很难有偏离均值多倍标准差的数据 中,我们简要介绍了数据集

数据直觉:任意数据集都很难有偏离均值多倍标准差的数据

摘要: 对任意数据集,很难有偏离均值多倍标准差的数据 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 新拿到一份业务数据,在分析这份数据的时候,我们往往从均值和标准差入手。本文我们推导均值和标准差的两

数理统计学简史

摘要: 《数理统计学简史》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 数理统计学简史 作者:陈希孺 《数理统计学简史》 早期概率论——从萌芽到《

参数估计与假设检验基础

摘要: 参数估计与假设检验基础 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 用假设检验解决决策问题收集数据 -> 数据分析 -> 建立一个统计模型 -> 验证模型的拟合

概率论最基础的内容

摘要: 概率率最基础的内容,常见的分布 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 现实世界的不确定性是普遍存在的,要描述不确定现象的规律,需要用到概率论所提供的理论和方法。 当不能获得总

皮尔逊相关系数

摘要: 皮尔逊相关系数 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 皮尔逊相关系数是一种反映两个变量之间线性相关程度强弱的统计量,绝对值越大,相关性越强。 关于两个变量间相关性的度量的评价

两列数据的相关性和独立性的度量

摘要: 两列数据的相关性和独立性 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings $1 关联度量给定两个随机变量 X, Y,如何判断这两个随机变量是否相互独立。 首先我们看一下 X 与 Y 的

随机抽样与样本偏差

摘要: 随机抽样与样本偏差 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 在大数据时代,看起来好像是由于算力提高,抽样的作用弱化了。但是实际上由于我们面对大数据的是数据质量不一,相关性各异的

分层抽样

摘要: 分层抽样 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 分层抽样的概念抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为

数据分布特征的统计描述

摘要: 数据分布特征的统计描述 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 本文简要梳理一下数据分布特征的统计描述,以及相应的 Python 代码。 主要涉及以下内容 集中趋势 众数

贝叶斯思维

摘要: 《贝叶斯思维》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 贝叶斯思维 第二版 第二版的 Jupyter Notebook 代码: https://github.com/Alle

统计思维(第二版)

摘要: 《统计思维》 【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】我的网站:潮汐朝夕的生活实验室我的公众号:算法题刷刷我的知乎:潮汐朝夕我的github:FennelDumplings我的leetcode:FennelDumplings 统计思维(第2版) 知乎电子书链接 代码: https://github.com/AllenDowney/ThinkSt