统计概率思维及概率在日常生活中的应用
统计概率思维:描述统计分析
描述统计学就是用几个关键的数字来描述数据集的整体情况,描述数据集的四个指标:平均值、四分位数、标准差、标准分
平
统计概率思维及概率在日常生活中的应用 统计概率思维:描述统计分析 描述统计学就是用几个关键的数字来描述数据集的整体情况,描述数据集的四个指标:平均值、四分位数、标准差、标准分 平均值 猴子通过工资如何被平均的案例来解释了平均数的概念,平均数=总收入/人数,但是当数据中有异常数值时,用平均数来描述数据集的整体情况是不准确的。如下图所示: 四分位数 猴子介绍了中位数跟四分位数的概念,下面的图片是笔记 案例分析:就餐人员距离 从案例的图片以及绘制的箱线图表明了就餐人员大部分分布在下四分位数和中位数之间,因为中位数离下四分位数较近,所以表示大部分数据位于中位数与下四分位数之间。 四分位数的应用1:不同类别的数据比较 四分位数的应用2:识别出可能的异常值并对异常值进行检查和处理 如何从数据中找出异常值 采用Tukey’s test方法来识别异常值的范围,红色是中度异常的范围,蓝色是极度异常的范围。 标准差 标准差是衡量数据集的波动大小 标准差的单位是根据数据的单位统一的标准差是大一点好还是小一点需要根据实际情况来判断,如果研究的数据是生产机器的标准零件,我们会希望标准差小一点比较好,这样才能保证所有零件的大小都是一致的,波动性也最小;如果研究大公司的工资,那么我们希望其标准差大一点比较好,因为大公司的工资会因为职位的不同,波动性比较大的。标准分 标准分的意义:标准分=距离平均值多少个标准差 这个标准差应用概率论,通常用每百万次采样数的缺陷率来衡量。 1个标准差,就是每万件抽样中,有69万个不合格,相当于一本书每页有170个错别字。 3个标准差就是每百万件抽样中,有6.7万个不合格,相当于一本书每页有1.5个错字。 6个标准差就是每百万件抽样中,有3.4个不合格,相当于整个小型图书馆的所有藏书中,只有1个错别字。 总结: 应用概率思维发现人生机会 什么是概率 概率=用数值来表示某件事发生的可能性 如何计算概率 事件A的概率=发生事件A的可能个数/所有可能的结果总数 复杂概率计算方法寻找经验概率值,即查找已经计算好的概率值;2)数据分析赌徒谬论 绝大多数赌徒倾向于相信之前的下注结果对当前下注有影响 小数定律 如果统计数据很少,那么事件就表现为各种极端请看看,而这些情况都是偶然事件,跟它的期望值一点关系都没有。 大数定律 如果统计数据足够大,那么事物出现的频率就能无限接近它的期望。 墨菲定律 凡是只要可能出错,就会出错 总结: (编辑:92站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |