相关文章推荐
耍酷的蘑菇  ·  jQuery获取数组对象的值 - 简书·  1 年前    · 
飘逸的作业本  ·  图数据库图计算公式-火山引擎·  1 年前    · 
仗义的沙发  ·  AWS S3 ...·  1 年前    · 
胆小的豆浆  ·  【拓展】谈谈字符编码:Unicode编码与e ...·  1 年前    · 
安静的斑马  ·  oracle 时间转换为时间戳 - 小海葵 ...·  2 年前    · 
小百科  ›  《数据可视化基础》第七章:聚居可视化:经验日积月累聚居函数和q-q图-腾讯云开发者社区-腾讯云
大数据 云数据 数据可视化 分布函数
宽容的橡皮擦
1 年前
医学数据库百科
0 篇文章

《数据可视化基础》第七章:分布可视化:经验累积分布函数和q-q图

前往专栏
腾讯云
开发者社区
文档 意见反馈 控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
发布
首页
学习
活动
专区
工具
TVP 最新优惠活动
返回腾讯云官网
医学数据库百科
首页
学习
活动
专区
工具
TVP 最新优惠活动
返回腾讯云官网
社区首页 > 专栏 > 医学数据库百科 > 《数据可视化基础》第七章:分布可视化:经验累积分布函数和q-q图

《数据可视化基础》第七章:分布可视化:经验累积分布函数和q-q图

作者头像
医学数据库百科
发布 于 2020-07-17 11:45:11
2.1K 0
发布 于 2020-07-17 11:45:11
举报

以下部分是基于《Fundamentals of Data Visualization》学习笔记,要是有兴趣的话,可以直接看原版书籍:https://serialmentor.com/dataviz/

上一章我们说到的 直方图以及密度曲线 在可视化数据分布的时候会,其图形的形成可以通过不同的分组来进行调整。这种只要涉及到人工调整的部分,在很大程度上就会对数据的分布产生误解。为了解决这种人工调整的问题,所以就有了 经验累积分布函数(ecdfs)以及q-q图 来说明数据分布的问题。不幸的是,它们比柱状图或密度图更不直观。

1. 经验累积分布函数

为了说明经验累积分布函数,我们这里使用一个学生成绩的数据集。假设班有50名学生,这些学生刚刚进行了一个测试。这个测试的结果是以0-100的分数来体现的。我们要如何更好的可视化结果呢?例如确定成绩的最大值和最小值。

对于这个数据的可视化,我们可以先获得一个按照学生成绩升序排序的表格。

在 X轴映射所有学生的得分,在Y轴映射排名 。最后通过点图和梯度连接线来进行可视化数据。就出现了简单的经验累积分布函数(ecdf)或简单地是累积分布。在这个图里面,每一个点代表一个学生的排名以及其得分。

?的图形是按照递增的结果来进行展示的,如果我们要变成递减的话,那就变成?这个样子了。

对于递增和递减的两个分布曲线而言, 递增的更加常用 。但是在可视化 高度偏态 的数据的时候,递减的结果可能更好一些。

?两个图形的Y轴,我们使用的是学生的绝对排名。同样的,我们可以把Y轴转换为学生的 累积占比 。这样的话,我们就可以直接获得一些数据的关键信息了。例如在大约有25%的学生的成绩是低于75分的。这个数据的中位值(0.5的位置)是81分左右。

2. qq图

如果想要确定我们的 数据是否符合某一个分布 ,这个是有一般可以使用qq图(Quantile–quantile plot)。与ecdfs一样,q-q图也基于对数据进行排名并可视化等级与实际值之间的关系。但是,在q-q图中,我们不直接绘制等级,而是使用它们来预测如果数据根据指定的参考分布进行分配,则给定数据点应位于何处。最常见的是,q-q图是使用正态分布作为参考来构建的。

举一个具体的例子,假设实际数据值的平均值为10,标准差为3。然后,假设数据符合正态分布。那么在正态分布当中,第50%位数据点的值是10(平均值)。第84%位数据点的值是13(比平均值高一个标准偏差),第2.3%位数据点的值是4(比平均值低两个标准偏差)。经过这样的计算。我们就获得了一个列新的数据。这一列的数据是如果数据符合目标分布(这里例子里面是正态分布)。那么具体的值是多少。

下面我们对这两列的数据进行绘制点图。如果所有的数据点都在对角线上,那么就说明我们测量的数据和理论分布的数据是相同的。那么就是符合目标分布。如果没有在对角线上那么久不符合目标分布。

本文参与 腾讯云自媒体分享计划 ,分享自微信公众号。
原始发表:2020-07-16 ,如有侵权请联系 cloudcommunity@tencent.com 删除
node.js

本文分享自 数据库百科 微信公众号, 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

node.js
评论
登录 后参与评论
0 条评论
热度
最新
登录 后参与评论
关于作者
医学数据库百科
0
文章
0
累计阅读量
0
获赞
前往专栏
目录
  • 1. 经验累积分布函数
  • 2. qq图
领券
  • 社区

    • 专栏文章
    • 阅读清单
    • 互动问答
    • 技术沙龙
    • 技术视频
    • 团队主页
    • 腾讯云TI平台
  • 活动

    • 自媒体分享计划
    • 邀请作者入驻
    • 自荐上首页
    • 技术竞赛
  • 资源

    • 技术周刊
    • 社区标签
    • 开发者手册
    • 开发者实验室
  • 关于

    • 社区规范
    • 免责声明
    • 联系我们
    • 友情链接

腾讯云开发者

扫码关注腾讯云开发者

扫码关注腾讯云开发者

领取腾讯云代金券

热门产品

  • 域名注册
  • 云服务器
  • 区块链服务
  • 消息队列
  • 网络加速
  • 云数据库
  • 域名解析
  • 云存储
  • 视频直播

热门推荐

  • 人脸识别
  • 腾讯会议
  • 企业云
  • CDN加速
  • 视频通话
  • 图像分析
  • MySQL 数据库
  • SSL 证书
  • 语音识别

更多推荐

  • 数据安全
  • 负载均衡
  • 短信
  • 文字识别
  • 云点播
  • 商标注册
  • 小程序开发
  • 网站监控
  • 数据迁移

Copyright © 2013 - 2024 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有

深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569

腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287

问题归档 专栏文章 快讯文章归档 关键词归档 开发者手册归档 开发者手册 Section 归档

Copyright © 2013 - 2024 Tencent Cloud.

All Rights Reserved. 腾讯云 版权所有

登录 后参与评论
 
推荐文章
耍酷的蘑菇  ·  jQuery获取数组对象的值 - 简书
1 年前
飘逸的作业本  ·  图数据库图计算公式-火山引擎
1 年前
仗义的沙发  ·  AWS S3 获取桶对象数量_恋喵大鲤鱼的博客-CSDN博客
1 年前
胆小的豆浆  ·  【拓展】谈谈字符编码:Unicode编码与emoji表情编码_pingan8787的技术博客_51CTO博客
1 年前
安静的斑马  ·  oracle 时间转换为时间戳 - 小海葵 - 博客园
2 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
小百科 - 百科知识指南
© 2024 ~ 沪ICP备11025650号